डीवीजीटी मॉडल स्वायत्त ड्राइविंग के लिए घने 3डी मानचित्रों का पुनर्निर्माण करता है

2026 February 08 | स्पेनिश से अनुवादित
Representación visual del modelo DVGT generando un mapa 3D denso de una calle urbana a partir de múltiples vistas de cámara, mostrando la reconstrucción geométrica detallada del entorno.

DVGT मॉडल स्वायत्त ड्राइविंग के लिए घने 3D मानचित्र पुनर्निर्माण करता है

ड्राइविंग विज़ुअल ज्योमेट्री ट्रांसफॉर्मर (DVGT) स्वायत्त वाहनों के लिए धारणा में एक प्रगति का प्रतिनिधित्व करता है। यह मॉडल कैमरा छवियों की अनुक्रमों से सीधे पर्यावरण के घने 3D मानचित्र बनाता है, कैमरा को सटीक रूप से कैलिब्रेट करने की आवश्यकता या महंगे बाहरी सेंसर जैसे LiDAR का उपयोग किए बिना। इसका शुद्ध दृष्टि आधारित दृष्टिकोण धारणा श्रृंखला को सरल बनाता है 🚗।

ज्योमेट्री अनुमान के लिए ध्यान तंत्र

DVGT में ट्रांसफॉर्मर वास्तुकला तीन विशेषज्ञ ध्यान तंत्रों के माध्यम से दृश्य जानकारी को संसाधित करता है जो संयुक्त रूप से कार्य करते हैं। यह रणनीति इसे विभिन्न कैमरा कॉन्फ़िगरेशन और गतिशील परिदृश्यों के अनुकूल होने की अनुमति देती है, जिससे सटीक मीट्रिक ज्योमेट्री उत्पन्न होती है।

DVGT के ध्यान के तीन स्तंभ:
स्थानिक और कालिक ध्यान का संयोजन मॉडल के लिए कुंजी है कि विशेष हार्डवेयर पर निर्भर किए बिना वास्तविक समय में दुनिया की 3D संरचना को समझे।

स्थापित बेंचमार्क को पार करने वाले परिणाम

प्रयोगात्मक मूल्यांकनों में, DVGT ड्राइविंग दृश्यों के कई सार्वजनिक डेटासेट पर 3D पुनर्निर्माण के पूर्व मॉडलों को पार करता है। विविध स्थितियों में इसकी मजबूती केवल दृष्टि का उपयोग करने वाले धारणा प्रणालियों की क्षमता दर्शाती है।

मॉडल द्वारा प्रदर्शित लाभ:

व्यावहारिक स्वायत्त धारणा की ओर एक कदम

DVGT की 3D में पर्यावरण पुनर्निर्माण करने की सटीक और कुशल क्षमता तकनीक को अधिक सुलभ और विश्वसनीय स्वायत्त ड्राइविंग प्रणालियों के करीब लाती है। यह दृष्टिकोण एक ऐसे भविष्य को करीब लाता है जहां वाहन अपने पर्यावरण को ऐसी गहराई और समझ के साथ समझता है जो कभी-कभी जटिल कार्यों में मानव धारणा से प्रतिस्पर्धा कर सकता है 🧠।