सात अरब पैरामीटर वाला एआई एजेंट पेशेवर प्रेजेंटेशन तैयार करता है

2026 March 18 | स्पेनिश से अनुवादित

रचनात्मक कार्यों की स्वचालन जैसे प्रस्तुतियों का निर्माण में महत्वपूर्ण छलांग लगी है। हाल ही में एक शोध ने एक AI एजेंट विकसित किया है, जो बड़े भाषा मॉडल पर आधारित है, जो विषयों की जांच करना सीखता है, सामग्री की योजना बनाता है और HTML में पेशेवर प्रस्तुतियां उत्पन्न करता है। सबसे उल्लेखनीय बात यह है कि इस एजेंट ने केवल अपने 0.5% पैरामीटर्स का फाइन-ट्यूनिंग करने के बाद, क्लाउड ओपस जैसे विशाल मॉडलों के 91.2% गुणवत्ता प्राप्त की है, जो दर्शाता है कि निर्देशों के निष्पादन में दक्षता मात्र स्केल को पार कर सकती है।

Un diagrama de flujo muestra a un agente de IA investigando, planificando y generando una presentación HTML en una pantalla de ordenador.

प्रबलन द्वारा प्रशिक्षण और छह आयामों का पुरस्कार प्रणाली 🤖

एजेंट को OpenEnv के साथ संगत प्रबलन सीखने के वातावरण में GRPO विधि का उपयोग करके प्रशिक्षित किया जाता है। इसके प्रदर्शन की कुंजी एक नवीन बहु-घटक पुरस्कार प्रणाली है जो उत्पन्न स्लाइड्स की गुणवत्ता को कई कोणों से मूल्यांकन करती है। इसमें संरचनात्मक सत्यापन, रेंडरिंग गुणवत्ता का मूल्यांकन, दूसरे LLM द्वारा सौंदर्य स्कोरिंग, सामग्री मेट्रिक्स और उल्टे विनिर्देश का पुरस्कार शामिल है। यह अंतिम विशेष रूप से चतुर है: दूसरा LLM उत्पन्न स्लाइड्स से प्रस्तुति का मूल लक्ष्य पुनर्प्राप्त करने का प्रयास करता है, इस प्रकार परिणाम की संचारात्मक निष्ठा को मापता है।

निर्देशों का पालन, कृत्रिम बुद्धिमत्ता की नई सीमा 🚀

यह कार्य केवल तकनीकी प्रगति से आगे जाता है। छह मॉडलों की तुलना से पता चलता है कि एजेंटिव कार्यों में प्रदर्शन का निर्धारक कारक पैरामीटर्स की संख्या नहीं है, बल्कि निर्देशों का पालन करने और उपकरणों का सुसंगत उपयोग करने की क्षमता है। यह एक परिवर्तनकारी बदलाव को इंगित करता है: रचनात्मक और कार्यालय कार्यों में स्वचालन का भविष्य केवल बड़े मॉडलों पर निर्भर नहीं करेगा, बल्कि जटिल तर्क और क्रिया श्रृंखलाओं को समझने और निष्पादित करने के लिए बेहतर प्रशिक्षित एजेंटों पर होगा।

रचनात्मक कार्यों के स्वचालन, जैसे हल्के AI मॉडल द्वारा प्रस्तुतियों का निर्माण, डिजिटल समाज में पेशेवर की भूमिका और मानवीय रचनात्मकता के मूल्य को कितनी हद तक पुनर्परिभाषित करता है?

(पीडी: इंटरनेट पर एक उपनाम को बैन करने की कोशिश सूरज को उंगली से ढकने जैसी है... लेकिन डिजिटल रूप में)