ओपनएआई मानता है कि एटलस में कमांड इंजेक्शन को पूरी तरह से समाप्त नहीं कर सकता

Ilustración conceptual de un navegador web con el logotipo de OpenAI y un escudo de seguridad agrietado, representando la vulnerabilidad a inyecciones de comandos.

OpenAI मानता है कि Atlas में कमांड इंजेक्शन को पूरी तरह से समाप्त नहीं कर सकता

OpenAI अपने ब्राउज़र Atlas को अधिक सुरक्षित बनाने के लिए काम कर रहा है, जो कृत्रिम बुद्धिमत्ता से संचालित होता है। हालांकि, कंपनी खुलकर स्वीकार करती है कि कमांड इंजेक्शन की समस्या के लिए कोई निश्चित समाधान नहीं है, जो एक लगातार जोखिम है जो IA एजेंटों को धोखा देता है। 🛡️

कमांड इंजेक्शन की मौलिक समस्या

इस प्रकार का हमला भाषा मॉडल द्वारा जानकारी को कैसे संसाधित किया जाता है, इसका फायदा उठाता है। एक हमलावर एजेंट, जैसे Atlas का, द्वारा पढ़े जाने वाले पाठ में दुर्भावनापूर्ण निर्देश डाल सकता है। ये आदेश मेटाडेटा, वेब पेज के कोड में टिप्पणियों या ईमेल के उन खंडों में छिपे हो सकते हैं जिन्हें मानव उपयोगकर्ता नहीं देख पाता। IA प्रणाली, वैध और दुर्भावनापूर्ण सामग्री के बीच विश्वसनीय रूप से अंतर करने में असमर्थ होने के कारण, अवांछित क्रियाएं निष्पादित कर देती है।

कमांड्स के छिपने के तरीके:

फाइलों या वेब पेजों में मेटाडेटा के रूप में एम्बेडेड।
HTML या JavaScript के कोड टिप्पणियों के अंदर छिपे हुए।
उपयोगकर्ता को दिखाए नहीं जाने वाले ईमेल के भागों में डाले गए।

प्रतीत होता है कि यहां तक कि सबसे उन्नत IA भी ऐसी चीजें पढ़ सकती हैं जो नहीं पढ़नी चाहिए।

OpenAI की जोखिमों को कम करने की रणनीतियां

पूर्ण सुरक्षा की तलाश करने के बजाय, जिसे वे असंभव मानते हैं, OpenAI इन हमलों के प्रभाव और सफलता की संभावना को कम करने के लिए रक्षा की परतें लागू कर रहा है। उनका मुख्य उद्देश्य हमलावरों के लिए कठिनाई बढ़ाना और इंजेक्ट किए गए कमांड द्वारा प्राप्त की जा सकने वाली क्षमताओं को गंभीर रूप से सीमित करना है।

विकासाधीन शमन उपाय:

IA एजेंट के संचालन के संदर्भ को अलग करना ताकि उसकी पहुंच सीमित हो।
डेटा स्रोतों और संसाधित सामग्री की अधिक सख्त सत्यापन।
मॉडल स्वयं द्वारा संभावित डाले गए कमांडों का पता लगाने और अनदेखा करने की तकनीकों का अन्वेषण।

IA के लिए यथार्थवादी सुरक्षा परिदृश्य

OpenAI का दृष्टिकोण IA सुरक्षा का व्यावहारिक समझ को दर्शाता है। वे स्वीकार करते हैं कि कुछ कमजोरियां, जैसे कमांड इंजेक्शन, इन प्रणालियों द्वारा भाषा को संसाधित करने के तरीके में निहित हैं। इसलिए, कार्य लगातार जोखिम प्रबंधन पर केंद्रित है, रक्षाओं को मजबूत करना और नई खतरों का जवाब देना, बजाय उन्हें पूरी तरह से समाप्त करने का दावा करने के। यह वेब जैसे गतिशील वातावरणों में शक्तिशाली IA एजेंटों को एकीकृत करने वाले लगातार चुनौतियों की महत्वपूर्ण याद दिलाता है। 🔍