Команда Технического университета Мюнхена представила роботизированную систему, предназначенную для поиска повседневных потерянных объектов, таких как очки или пульт. Она сочетает создание 3D-карт в реальном времени с контекстными знаниями, извлеченными из интернета. Цель заключается в том, чтобы робот не только перемещался, но и интерпретировал окружение с логикой, похожей на человеческую, для оптимизации поиска.
Слияние пространственного зрения и моделей языка 🤖
Робот, оснащенный камерой глубины, строит детальную трехмерную карту пространства, маркируя объекты и мебель. Инновация заключается в интеграции двух систем ИИ: одной для визуального распознавания и другой — большой языковой модели. Последняя предоставляет общие знания об использовании пространств, позволяя роботу выводить, где наиболее вероятно найти объект. Таким образом, он отдаст предпочтение поиску ключей на столе, а не в холодильнике.
Прощай, поиск очков... которые на твоем лбу 😅
С этим разработкой, возможно, скоро мы сможем делегировать роботу эту лихорадочную поиск очков, которые неизменно находятся на нашей голове. Ирония в том, что после тщательного картирования дома и применения своего здравого смысла искусственного интеллекта робот укажет на нас своей механической рукой, издавая мягкий сигнал разочарования. Технологическое напоминание о нашей собственной рассеянности.