म्यूनिख तकनीकी विश्वविद्यालय की एक टीम ने रोजमर्रा की वस्तुओं जैसे चश्मा या रिमोट को खोजने के लिए डिज़ाइन किया गया एक रोबोटिक सिस्टम प्रस्तुत किया है। यह वास्तविक समय में 3D मानचित्र बनाने को इंटरनेट से निकाले गए संदर्भीय ज्ञान के साथ जोड़ता है। उद्देश्य यह है कि रोबोट न केवल नेविगेट करे, बल्कि मानव जैसी तर्कसंगतता के साथ पर्यावरण की व्याख्या करे ताकि खोज को अनुकूलित किया जा सके।
स्थानिक दृष्टि और भाषा मॉडलों का संलयन 🤖
रोबोट, जो गहराई कैमरे से लैस है, स्थान का विस्तृत त्रिविमीय मानचित्र बनाता है, जिसमें वस्तुओं और फर्नीचर को लेबल किया जाता है। नवाचार दो AI प्रणालियों को एकीकृत करने में निहित है: एक दृश्य पहचान के लिए और दूसरा, एक बड़ा भाषा मॉडल। बाद वाला स्थानों के उपयोग के बारे में सामान्य ज्ञान प्रदान करता है, जिससे रोबोट यह अनुमान लगा सकता है कि किसी वस्तु को कहाँ सबसे अधिक संभावना से पाया जाएगा। इस प्रकार, यह चाबियों को फ्रिज में खोजने से पहले मेज पर खोजने को प्राथमिकता देता है।
चश्मे की खोज को अलविदा... जो तुम्हारे माथे पर हैं 😅
इस विकास के साथ, शायद जल्द ही हम उस हड़बड़ाती हुई चश्मे की खोज को रोबोट को सौंप सकें, जो हमेशा हमारे सिर पर ही होते हैं। विडंबना यह होगी कि, घर का सूक्ष्मता से मानचित्रण करने और अपना कॉमन सेंस कृत्रिम लागू करने के बाद, रोबोट अपनी यांत्रिक भुजा से हमें इशारा करेगा जबकि निराशा का एक हल्का पिप्पी ध्वनि उत्सर्जित करेगा। हमारी अपनी विचलितता का एक तकनीकी अनुस्मारक।