रचनात्मक कार्यों की स्वचालन जैसे प्रस्तुतियों का निर्माण में महत्वपूर्ण छलांग लगी है। हाल ही में एक शोध ने एक AI एजेंट विकसित किया है, जो बड़े भाषा मॉडल पर आधारित है, जो विषयों की जांच करना सीखता है, सामग्री की योजना बनाता है और HTML में पेशेवर प्रस्तुतियां उत्पन्न करता है। सबसे उल्लेखनीय बात यह है कि इस एजेंट ने केवल अपने 0.5% पैरामीटर्स का फाइन-ट्यूनिंग करने के बाद, क्लाउड ओपस जैसे विशाल मॉडलों के 91.2% गुणवत्ता प्राप्त की है, जो दर्शाता है कि निर्देशों के निष्पादन में दक्षता मात्र स्केल को पार कर सकती है।
प्रबलन द्वारा प्रशिक्षण और छह आयामों का पुरस्कार प्रणाली 🤖
एजेंट को OpenEnv के साथ संगत प्रबलन सीखने के वातावरण में GRPO विधि का उपयोग करके प्रशिक्षित किया जाता है। इसके प्रदर्शन की कुंजी एक नवीन बहु-घटक पुरस्कार प्रणाली है जो उत्पन्न स्लाइड्स की गुणवत्ता को कई कोणों से मूल्यांकन करती है। इसमें संरचनात्मक सत्यापन, रेंडरिंग गुणवत्ता का मूल्यांकन, दूसरे LLM द्वारा सौंदर्य स्कोरिंग, सामग्री मेट्रिक्स और उल्टे विनिर्देश का पुरस्कार शामिल है। यह अंतिम विशेष रूप से चतुर है: दूसरा LLM उत्पन्न स्लाइड्स से प्रस्तुति का मूल लक्ष्य पुनर्प्राप्त करने का प्रयास करता है, इस प्रकार परिणाम की संचारात्मक निष्ठा को मापता है।
निर्देशों का पालन, कृत्रिम बुद्धिमत्ता की नई सीमा 🚀
यह कार्य केवल तकनीकी प्रगति से आगे जाता है। छह मॉडलों की तुलना से पता चलता है कि एजेंटिव कार्यों में प्रदर्शन का निर्धारक कारक पैरामीटर्स की संख्या नहीं है, बल्कि निर्देशों का पालन करने और उपकरणों का सुसंगत उपयोग करने की क्षमता है। यह एक परिवर्तनकारी बदलाव को इंगित करता है: रचनात्मक और कार्यालय कार्यों में स्वचालन का भविष्य केवल बड़े मॉडलों पर निर्भर नहीं करेगा, बल्कि जटिल तर्क और क्रिया श्रृंखलाओं को समझने और निष्पादित करने के लिए बेहतर प्रशिक्षित एजेंटों पर होगा।
रचनात्मक कार्यों के स्वचालन, जैसे हल्के AI मॉडल द्वारा प्रस्तुतियों का निर्माण, डिजिटल समाज में पेशेवर की भूमिका और मानवीय रचनात्मकता के मूल्य को कितनी हद तक पुनर्परिभाषित करता है?
(पीडी: इंटरनेट पर एक उपनाम को बैन करने की कोशिश सूरज को उंगली से ढकने जैसी है... लेकिन डिजिटल रूप में)