डीवीजीटी मॉडल स्वायत्त ड्राइविंग के लिए घने 3डी मानचित्रों का पुनर्निर्माण करता है

Representación visual del modelo DVGT generando un mapa 3D denso de una calle urbana a partir de múltiples vistas de cámara, mostrando la reconstrucción geométrica detallada del entorno.

DVGT मॉडल स्वायत्त ड्राइविंग के लिए घने 3D मानचित्र पुनर्निर्माण करता है

ड्राइविंग विज़ुअल ज्योमेट्री ट्रांसफॉर्मर (DVGT) स्वायत्त वाहनों के लिए धारणा में एक प्रगति का प्रतिनिधित्व करता है। यह मॉडल कैमरा छवियों की अनुक्रमों से सीधे पर्यावरण के घने 3D मानचित्र बनाता है, कैमरा को सटीक रूप से कैलिब्रेट करने की आवश्यकता या महंगे बाहरी सेंसर जैसे LiDAR का उपयोग किए बिना। इसका शुद्ध दृष्टि आधारित दृष्टिकोण धारणा श्रृंखला को सरल बनाता है 🚗।

ज्योमेट्री अनुमान के लिए ध्यान तंत्र

DVGT में ट्रांसफॉर्मर वास्तुकला तीन विशेषज्ञ ध्यान तंत्रों के माध्यम से दृश्य जानकारी को संसाधित करता है जो संयुक्त रूप से कार्य करते हैं। यह रणनीति इसे विभिन्न कैमरा कॉन्फ़िगरेशन और गतिशील परिदृश्यों के अनुकूल होने की अनुमति देती है, जिससे सटीक मीट्रिक ज्योमेट्री उत्पन्न होती है।

DVGT के ध्यान के तीन स्तंभ:

इंट्रा-व्यू ध्यान: एकल व्यक्तिगत छवि के अंदर विवरण और संबंधों का विश्लेषण और कब्जा करता है।
इंटर-व्यू ध्यान (स्थानिक): थोड़े भिन्न कोणों से ली गई छवियों के बीच समकक्ष बिंदुओं को सहसंबद्ध करता है, त्रिकोणण और गहराई की गणना के लिए मौलिक।
इंटर-फ्रेम ध्यान (कालिक): वीडियो अनुक्रम के साथ-साथ बिंदुओं की गति को ट्रैक करता है, जो पुनर्निर्माण को मजबूत करता है और 3D मानचित्र में कालिक सुसंगतता प्रदान करता है।

स्थानिक और कालिक ध्यान का संयोजन मॉडल के लिए कुंजी है कि विशेष हार्डवेयर पर निर्भर किए बिना वास्तविक समय में दुनिया की 3D संरचना को समझे।

स्थापित बेंचमार्क को पार करने वाले परिणाम

प्रयोगात्मक मूल्यांकनों में, DVGT ड्राइविंग दृश्यों के कई सार्वजनिक डेटासेट पर 3D पुनर्निर्माण के पूर्व मॉडलों को पार करता है। विविध स्थितियों में इसकी मजबूती केवल दृष्टि का उपयोग करने वाले धारणा प्रणालियों की क्षमता दर्शाती है।

मॉडल द्वारा प्रदर्शित लाभ:

कैमरा की सटीक बाहरी कैलिब्रेशन के बिना घने और सुसंगत 3D मानचित्र उत्पन्न करता है।
विभिन्न प्रकार के कैमरों और कॉन्फ़िगरेशन को लचीले ढंग से संभालता है।
मीट्रिक ज्योमेट्री उत्पन्न करता है, जो स्वायत्त वाहन के लिए सुरक्षित नेविगेशन के लिए आवश्यक है।

व्यावहारिक स्वायत्त धारणा की ओर एक कदम

DVGT की 3D में पर्यावरण पुनर्निर्माण करने की सटीक और कुशल क्षमता तकनीक को अधिक सुलभ और विश्वसनीय स्वायत्त ड्राइविंग प्रणालियों के करीब लाती है। यह दृष्टिकोण एक ऐसे भविष्य को करीब लाता है जहां वाहन अपने पर्यावरण को ऐसी गहराई और समझ के साथ समझता है जो कभी-कभी जटिल कार्यों में मानव धारणा से प्रतिस्पर्धा कर सकता है 🧠।