आईए पोकेमॉन रेड फायर को स्क्रीन देखकर खेलता है, लेकिन बुनियादी बातों में भ्रमित हो जाता है

Anthropic ने अपनी कृत्रिम बुद्धिमत्ता को बिना किसी बाहरी सहायता के, केवल स्क्रीनशॉट का विश्लेषण करके पोकेमॉन रेड फायर को पूरा करने में सफलता दिलाई है। सिस्टम ने परीक्षण और त्रुटि से सीखा, एक मानव खिलाड़ी की तरह लेकिन बिना थकान के। हालाँकि, जब आप उससे राजनीति या स्वास्थ्य के बारे में कुछ पूछते हैं तो तार टूट जाता है: वह कल्पनाओं के साथ उत्तर देता है।

पुरानी गेम बॉय एडवांस स्क्रीन जिसमें पोकेमॉन युद्ध दृश्य, चारिज़ार्ड द्वारा फ्लेमथ्रोवर हमला, स्क्रीन के किनारों पर दिखाई देने वाली डिजिटल डेटा स्ट्रीम, डिवाइस के चारों ओर धीरे-धीरे चमकते AI न्यूरल नेटवर्क नोड्स, दाएं तरफ स्प्लिट स्क्रीन प्रभाव जिसमें भ्रमित राजनीतिक समाचार शीर्षक स्थैतिक में विलीन हो रहे हैं, स्क्रीन के निचले भाग को दूषित करने वाले ग्लिच आर्टिफैक्ट, स्क्रीन रिकॉर्ड करने वाले कैमरा आर्म के साथ हैंड्स-फ्री सेटअप, पृष्ठभूमि में पायथन कोड और टर्मिनल लॉग प्रदर्शित करने वाले कीबोर्ड और मॉनिटर, सिनेमाई तकनीकी चित्रण, नियॉन नीली और लाल रोशनी, फोटोरियलिस्टिक इंजीनियरिंग विज़ुअलाइज़ेशन, एनीमेशन हमले पर मोशन ब्लर, दूषित क्षेत्र से फैलने वाले चमकते त्रुटि कण, अति-विस्तृत हार्डवेयर बनावट

मानवीय हस्तक्षेप के बिना दृश्य सुदृढीकरण सीखना 🎮

Anthropic का मॉडल गेम के प्रत्येक फ्रेम को एक स्थिर छवि के रूप में संसाधित करता है, पुरस्कारों के आधार पर गति और युद्ध के निर्णय लेता है। यह RAM मेमोरी या कार्ट्रिज के आंतरिक डेटा तक नहीं पहुँचता है। यह स्प्राइट और टेक्स्ट की पहचान करने के लिए कन्वोल्यूशनल न्यूरल नेटवर्क और मार्ग को अनुकूलित करने वाले एक सुदृढीकरण एल्गोरिदम का उपयोग करता है। प्रशिक्षण के लिए हजारों सिम्युलेटेड गेम की आवश्यकता थी, लेकिन परिणाम एक ऐसा एजेंट है जो खेल के नियमों को जाने बिना एलीट फोर को हराने में सक्षम है।

यह गेम पास करता है, लेकिन यह नहीं जानता कि राजनीतिक दल क्या होता है 🤖

वही AI जो एक उच्च-स्तरीय चार्मांडर के साथ म्यूटू को हराता है, यदि आप उसे स्वास्थ्य प्रणाली समझाने के लिए कहें तो वह खाली हो जाता है। यह एक ऐसे दोस्त की तरह है जो दस सेकंड में रूबिक क्यूब हल कर देता है लेकिन सोचता है कि फिनलैंड अफ्रीका में है। पिक्सल में बहुत कुशल, लेकिन शून्य सामान्य ज्ञान। कम से कम वह लोडिंग समय के बारे में शिकायत नहीं करता या हर पाँच मिनट में गेम सेव करने के लिए नहीं कहता।