
DVGT मॉडल स्वायत्त ड्राइविंग के लिए घने 3D मानचित्र पुनर्निर्माण करता है
ड्राइविंग विज़ुअल ज्योमेट्री ट्रांसफॉर्मर (DVGT) स्वायत्त वाहनों के लिए धारणा में एक प्रगति का प्रतिनिधित्व करता है। यह मॉडल कैमरा छवियों की अनुक्रमों से सीधे पर्यावरण के घने 3D मानचित्र बनाता है, कैमरा को सटीक रूप से कैलिब्रेट करने की आवश्यकता या महंगे बाहरी सेंसर जैसे LiDAR का उपयोग किए बिना। इसका शुद्ध दृष्टि आधारित दृष्टिकोण धारणा श्रृंखला को सरल बनाता है 🚗।
ज्योमेट्री अनुमान के लिए ध्यान तंत्र
DVGT में ट्रांसफॉर्मर वास्तुकला तीन विशेषज्ञ ध्यान तंत्रों के माध्यम से दृश्य जानकारी को संसाधित करता है जो संयुक्त रूप से कार्य करते हैं। यह रणनीति इसे विभिन्न कैमरा कॉन्फ़िगरेशन और गतिशील परिदृश्यों के अनुकूल होने की अनुमति देती है, जिससे सटीक मीट्रिक ज्योमेट्री उत्पन्न होती है।
DVGT के ध्यान के तीन स्तंभ:- इंट्रा-व्यू ध्यान: एकल व्यक्तिगत छवि के अंदर विवरण और संबंधों का विश्लेषण और कब्जा करता है।
- इंटर-व्यू ध्यान (स्थानिक): थोड़े भिन्न कोणों से ली गई छवियों के बीच समकक्ष बिंदुओं को सहसंबद्ध करता है, त्रिकोणण और गहराई की गणना के लिए मौलिक।
- इंटर-फ्रेम ध्यान (कालिक): वीडियो अनुक्रम के साथ-साथ बिंदुओं की गति को ट्रैक करता है, जो पुनर्निर्माण को मजबूत करता है और 3D मानचित्र में कालिक सुसंगतता प्रदान करता है।
स्थानिक और कालिक ध्यान का संयोजन मॉडल के लिए कुंजी है कि विशेष हार्डवेयर पर निर्भर किए बिना वास्तविक समय में दुनिया की 3D संरचना को समझे।
स्थापित बेंचमार्क को पार करने वाले परिणाम
प्रयोगात्मक मूल्यांकनों में, DVGT ड्राइविंग दृश्यों के कई सार्वजनिक डेटासेट पर 3D पुनर्निर्माण के पूर्व मॉडलों को पार करता है। विविध स्थितियों में इसकी मजबूती केवल दृष्टि का उपयोग करने वाले धारणा प्रणालियों की क्षमता दर्शाती है।
मॉडल द्वारा प्रदर्शित लाभ:- कैमरा की सटीक बाहरी कैलिब्रेशन के बिना घने और सुसंगत 3D मानचित्र उत्पन्न करता है।
- विभिन्न प्रकार के कैमरों और कॉन्फ़िगरेशन को लचीले ढंग से संभालता है।
- मीट्रिक ज्योमेट्री उत्पन्न करता है, जो स्वायत्त वाहन के लिए सुरक्षित नेविगेशन के लिए आवश्यक है।
व्यावहारिक स्वायत्त धारणा की ओर एक कदम
DVGT की 3D में पर्यावरण पुनर्निर्माण करने की सटीक और कुशल क्षमता तकनीक को अधिक सुलभ और विश्वसनीय स्वायत्त ड्राइविंग प्रणालियों के करीब लाती है। यह दृष्टिकोण एक ऐसे भविष्य को करीब लाता है जहां वाहन अपने पर्यावरण को ऐसी गहराई और समझ के साथ समझता है जो कभी-कभी जटिल कार्यों में मानव धारणा से प्रतिस्पर्धा कर सकता है 🧠।