Un equipo de la Universidad Técnica de Múnich ha presentado un sistema robótico diseñado para localizar objetos cotidianos extraviados, como unas gafas o un mando. Combina la creación de mapas 3D en tiempo real con conocimiento contextual extraído de internet. El objetivo es que el robot no solo navegue, sino que interprete el entorno con una lógica similar a la humana para optimizar la búsqueda.
La fusión de visión espacial y modelos de lenguaje 🤖
El robot, equipado con una cámara de profundidad, construye un mapa tridimensional detallado del espacio, etiquetando objetos y muebles. La innovación reside en integrar dos sistemas de IA: uno para el reconocimiento visual y otro, un modelo de lenguaje grande. Este último aporta conocimiento general sobre el uso de los espacios, permitiendo al robot deducir dónde es más probable hallar un objeto. Así, prioriza buscar unas llaves en una mesa antes que en la nevera.
Adiós a buscar las gafas... que están en tu frente 😅
Con este desarrollo, quizá pronto podamos delegar en un robot esa búsqueda frenética de las gafas que, invariablemente, están sobre nuestra cabeza. La ironía sería que, tras mapear meticulosamente la casa y aplicar su sentido común artificial, el robot nos señalara con su brazo mecánico mientras emite un suave pitido de decepción. Un recordatorio tecnológico de nuestra propia distracción.