Anthropic ने अपनी कृत्रिम बुद्धिमत्ता को बिना किसी बाहरी सहायता के, केवल स्क्रीनशॉट का विश्लेषण करके पोकेमॉन रेड फायर को पूरा करने में सफलता दिलाई है। सिस्टम ने परीक्षण और त्रुटि से सीखा, एक मानव खिलाड़ी की तरह लेकिन बिना थकान के। हालाँकि, जब आप उससे राजनीति या स्वास्थ्य के बारे में कुछ पूछते हैं तो तार टूट जाता है: वह कल्पनाओं के साथ उत्तर देता है।
मानवीय हस्तक्षेप के बिना दृश्य सुदृढीकरण सीखना 🎮
Anthropic का मॉडल गेम के प्रत्येक फ्रेम को एक स्थिर छवि के रूप में संसाधित करता है, पुरस्कारों के आधार पर गति और युद्ध के निर्णय लेता है। यह RAM मेमोरी या कार्ट्रिज के आंतरिक डेटा तक नहीं पहुँचता है। यह स्प्राइट और टेक्स्ट की पहचान करने के लिए कन्वोल्यूशनल न्यूरल नेटवर्क और मार्ग को अनुकूलित करने वाले एक सुदृढीकरण एल्गोरिदम का उपयोग करता है। प्रशिक्षण के लिए हजारों सिम्युलेटेड गेम की आवश्यकता थी, लेकिन परिणाम एक ऐसा एजेंट है जो खेल के नियमों को जाने बिना एलीट फोर को हराने में सक्षम है।
यह गेम पास करता है, लेकिन यह नहीं जानता कि राजनीतिक दल क्या होता है 🤖
वही AI जो एक उच्च-स्तरीय चार्मांडर के साथ म्यूटू को हराता है, यदि आप उसे स्वास्थ्य प्रणाली समझाने के लिए कहें तो वह खाली हो जाता है। यह एक ऐसे दोस्त की तरह है जो दस सेकंड में रूबिक क्यूब हल कर देता है लेकिन सोचता है कि फिनलैंड अफ्रीका में है। पिक्सल में बहुत कुशल, लेकिन शून्य सामान्य ज्ञान। कम से कम वह लोडिंग समय के बारे में शिकायत नहीं करता या हर पाँच मिनट में गेम सेव करने के लिए नहीं कहता।