
OpenAI मानता है कि Atlas में कमांड इंजेक्शन को पूरी तरह से समाप्त नहीं कर सकता
OpenAI अपने ब्राउज़र Atlas को अधिक सुरक्षित बनाने के लिए काम कर रहा है, जो कृत्रिम बुद्धिमत्ता से संचालित होता है। हालांकि, कंपनी खुलकर स्वीकार करती है कि कमांड इंजेक्शन की समस्या के लिए कोई निश्चित समाधान नहीं है, जो एक लगातार जोखिम है जो IA एजेंटों को धोखा देता है। 🛡️
कमांड इंजेक्शन की मौलिक समस्या
इस प्रकार का हमला भाषा मॉडल द्वारा जानकारी को कैसे संसाधित किया जाता है, इसका फायदा उठाता है। एक हमलावर एजेंट, जैसे Atlas का, द्वारा पढ़े जाने वाले पाठ में दुर्भावनापूर्ण निर्देश डाल सकता है। ये आदेश मेटाडेटा, वेब पेज के कोड में टिप्पणियों या ईमेल के उन खंडों में छिपे हो सकते हैं जिन्हें मानव उपयोगकर्ता नहीं देख पाता। IA प्रणाली, वैध और दुर्भावनापूर्ण सामग्री के बीच विश्वसनीय रूप से अंतर करने में असमर्थ होने के कारण, अवांछित क्रियाएं निष्पादित कर देती है।
कमांड्स के छिपने के तरीके:- फाइलों या वेब पेजों में मेटाडेटा के रूप में एम्बेडेड।
- HTML या JavaScript के कोड टिप्पणियों के अंदर छिपे हुए।
- उपयोगकर्ता को दिखाए नहीं जाने वाले ईमेल के भागों में डाले गए।
प्रतीत होता है कि यहां तक कि सबसे उन्नत IA भी ऐसी चीजें पढ़ सकती हैं जो नहीं पढ़नी चाहिए।
OpenAI की जोखिमों को कम करने की रणनीतियां
पूर्ण सुरक्षा की तलाश करने के बजाय, जिसे वे असंभव मानते हैं, OpenAI इन हमलों के प्रभाव और सफलता की संभावना को कम करने के लिए रक्षा की परतें लागू कर रहा है। उनका मुख्य उद्देश्य हमलावरों के लिए कठिनाई बढ़ाना और इंजेक्ट किए गए कमांड द्वारा प्राप्त की जा सकने वाली क्षमताओं को गंभीर रूप से सीमित करना है।
विकासाधीन शमन उपाय:- IA एजेंट के संचालन के संदर्भ को अलग करना ताकि उसकी पहुंच सीमित हो।
- डेटा स्रोतों और संसाधित सामग्री की अधिक सख्त सत्यापन।
- मॉडल स्वयं द्वारा संभावित डाले गए कमांडों का पता लगाने और अनदेखा करने की तकनीकों का अन्वेषण।
IA के लिए यथार्थवादी सुरक्षा परिदृश्य
OpenAI का दृष्टिकोण IA सुरक्षा का व्यावहारिक समझ को दर्शाता है। वे स्वीकार करते हैं कि कुछ कमजोरियां, जैसे कमांड इंजेक्शन, इन प्रणालियों द्वारा भाषा को संसाधित करने के तरीके में निहित हैं। इसलिए, कार्य लगातार जोखिम प्रबंधन पर केंद्रित है, रक्षाओं को मजबूत करना और नई खतरों का जवाब देना, बजाय उन्हें पूरी तरह से समाप्त करने का दावा करने के। यह वेब जैसे गतिशील वातावरणों में शक्तिशाली IA एजेंटों को एकीकृत करने वाले लगातार चुनौतियों की महत्वपूर्ण याद दिलाता है। 🔍