집에서 열쇠나 리모컨을 잃어버린 사람이 누가 있겠습니까? 연구팀이 이 작업을 위해 설계된 로봇 시스템을 제시합니다. 3D 매핑과 인공 시각 능력을 인터넷 지식으로 훈련된 언어 모델과 결합합니다. 이는 상식을 제공하여 물체가 어디에 있을지 추론하고, 논리적 검색을 안내합니다.
지각과 상식의 융합 🤖
이 시스템은 두 단계로 작동합니다. 먼저 로봇이 방을 탐색하며 실시간 3D 맵을 생성하고 카메라로 물체를 식별합니다. 그런 다음 특정 요소를 검색할 때 언어 모델에 상담합니다. 인터넷 데이터로 훈련된 이 모델은 가능성 있는 위치를 제안합니다: 휴대폰은 콘센트 근처에, 책은 테이블 위에 있을 수 있습니다. 로봇은 스캔에서 이러한 영역을 우선시하여 검색을 더 효율적으로 만듭니다.
"방금 여기 있었어"라는 변명에 작별 😅
이 개발은 한 시대의 종말을 알릴 수 있습니다: 집 안을 어슬렁거리며 서랍을 무작정 열고 집 안 요정들을 탓하는 시대 말입니다. 이제 인터넷의 집단 지혜에 접근할 수 있는 로봇 증인이 데이터로 당신의 충전기가 소파 쿠션 뒤에 끝난다는 것을 지적할 수 있습니다. 당신 자신의 논리 부족이 기계에 의해 기록되고 분석되는 것에 대비하세요.