Un team dell'Università Tecnica di Monaco ha presentato un sistema robotico progettato per localizzare oggetti quotidiani smarriti, come un paio di occhiali o un telecomando. Combina la creazione di mappe 3D in tempo reale con conoscenza contestuale estratta da internet. L'obiettivo è che il robot non solo navighi, ma interpreti l'ambiente con una logica simile a quella umana per ottimizzare la ricerca.
La fusione di visione spaziale e modelli linguistici 🤖
Il robot, equipaggiato con una camera a profondità, costruisce una mappa tridimensionale dettagliata dello spazio, etichettando oggetti e mobili. L'innovazione risiede nell'integrare due sistemi di IA: uno per il riconoscimento visivo e un altro, un modello linguistico grande. Quest'ultimo apporta conoscenza generale sull'uso degli spazi, permettendo al robot di dedurre dove è più probabile trovare un oggetto. Così, dà priorità alla ricerca di chiavi su un tavolo piuttosto che in frigorifero.
Addio alla ricerca degli occhiali... che sono sulla tua fronte 😅
Con questo sviluppo, forse presto potremo delegare a un robot quella ricerca frenetica degli occhiali che, invariabilmente, sono sulla nostra testa. L'ironia sarebbe che, dopo aver mappato meticolosamente la casa e applicato il suo senso comune artificiale, il robot ci indicasse con il suo braccio meccanico mentre emette un lieve bip di delusione. Un promemoria tecnologico della nostra stessa distrazione.