सात अरब पैरामीटर वाला एआई एजेंट पेशेवर प्रेजेंटेशन तैयार करता है

रचनात्मक कार्यों की स्वचालन जैसे प्रस्तुतियों का निर्माण में महत्वपूर्ण छलांग लगी है। हाल ही में एक शोध ने एक AI एजेंट विकसित किया है, जो बड़े भाषा मॉडल पर आधारित है, जो विषयों की जांच करना सीखता है, सामग्री की योजना बनाता है और HTML में पेशेवर प्रस्तुतियां उत्पन्न करता है। सबसे उल्लेखनीय बात यह है कि इस एजेंट ने केवल अपने 0.5% पैरामीटर्स का फाइन-ट्यूनिंग करने के बाद, क्लाउड ओपस जैसे विशाल मॉडलों के 91.2% गुणवत्ता प्राप्त की है, जो दर्शाता है कि निर्देशों के निष्पादन में दक्षता मात्र स्केल को पार कर सकती है।

Un diagrama de flujo muestra a un agente de IA investigando, planificando y generando una presentación HTML en una pantalla de ordenador.

प्रबलन द्वारा प्रशिक्षण और छह आयामों का पुरस्कार प्रणाली 🤖

एजेंट को OpenEnv के साथ संगत प्रबलन सीखने के वातावरण में GRPO विधि का उपयोग करके प्रशिक्षित किया जाता है। इसके प्रदर्शन की कुंजी एक नवीन बहु-घटक पुरस्कार प्रणाली है जो उत्पन्न स्लाइड्स की गुणवत्ता को कई कोणों से मूल्यांकन करती है। इसमें संरचनात्मक सत्यापन, रेंडरिंग गुणवत्ता का मूल्यांकन, दूसरे LLM द्वारा सौंदर्य स्कोरिंग, सामग्री मेट्रिक्स और उल्टे विनिर्देश का पुरस्कार शामिल है। यह अंतिम विशेष रूप से चतुर है: दूसरा LLM उत्पन्न स्लाइड्स से प्रस्तुति का मूल लक्ष्य पुनर्प्राप्त करने का प्रयास करता है, इस प्रकार परिणाम की संचारात्मक निष्ठा को मापता है।

निर्देशों का पालन, कृत्रिम बुद्धिमत्ता की नई सीमा 🚀

यह कार्य केवल तकनीकी प्रगति से आगे जाता है। छह मॉडलों की तुलना से पता चलता है कि एजेंटिव कार्यों में प्रदर्शन का निर्धारक कारक पैरामीटर्स की संख्या नहीं है, बल्कि निर्देशों का पालन करने और उपकरणों का सुसंगत उपयोग करने की क्षमता है। यह एक परिवर्तनकारी बदलाव को इंगित करता है: रचनात्मक और कार्यालय कार्यों में स्वचालन का भविष्य केवल बड़े मॉडलों पर निर्भर नहीं करेगा, बल्कि जटिल तर्क और क्रिया श्रृंखलाओं को समझने और निष्पादित करने के लिए बेहतर प्रशिक्षित एजेंटों पर होगा।

रचनात्मक कार्यों के स्वचालन, जैसे हल्के AI मॉडल द्वारा प्रस्तुतियों का निर्माण, डिजिटल समाज में पेशेवर की भूमिका और मानवीय रचनात्मकता के मूल्य को कितनी हद तक पुनर्परिभाषित करता है?

(पीडी: इंटरनेट पर एक उपनाम को बैन करने की कोशिश सूरज को उंगली से ढकने जैसी है... लेकिन डिजिटल रूप में)