
Meanflow और imf एकल-चरण जनरेटिव मॉडलिंग को फिर से परिभाषित करते हैं
जनरेटिव मॉडलिंग क्षेत्र उच्च गुणवत्ता वाले नए डेटा बनाने का प्रयास करता है, और गति एक प्रमुख कारक है। MeanFlow एकल-चरण में उत्पन्न करने के लिए एक आशाजनक फ्रेमवर्क के रूप में उभरा, लेकिन इसकी तेज प्रगति की प्रकृति ने स्थिरता में बाधाएं पैदा कीं। अब, इसके कोर की गहन पुनर्संरचना ने iMF को जन्म दिया है, जो एक महत्वपूर्ण मील का पत्थर है। 🚀
प्रशिक्षण को स्थिर करने के लिए उद्देश्य को पुनर्संरचित करना
मुख्य समस्या मॉडल को प्रशिक्षित करने के तरीके में थी। मूल उद्देश्य न केवल वास्तविक डेटा पर निर्भर था, बल्कि न्यूरल नेटवर्क के बदलते राज्य पर भी, जो प्रक्रिया को जटिल बनाता था। समाधान था इस उद्देश्य को पुनर्परिभाषित करना तात्कालिक वेग पर गणना की गई हानि फलन के रूप में। इसे प्राप्त करने के लिए, प्रवाह के औसत वेग की भविष्यवाणी करने वाली एक सहायक नेटवर्क पेश की गई, जो तात्कालिक वेग को पुनःपरामर्शित करने की अनुमति देती है। यह परिवर्तन समस्या को अधिक पारंपरिक और सीधे प्रतिगमन में बदल देता है, जो प्रशिक्षण चक्र को बहुत स्थिर करता है।
पुनर्संरचना के प्रमुख लाभ:- जटिल अनुकूलन समस्या को मानक प्रतिगमन में बदल देता है, जो संभालना आसान है।
- औसत वेग की भविष्यवाणी करने वाली नेटवर्क प्रशिक्षण के दौरान स्थिरता एंकर के रूप में कार्य करती है।
- मॉडल को अधिक सुसंगत रूप से अभिसरण करने और कम उतार-चढ़ाव के साथ अनुमति देता है।
"कभी-कभी, चीजों को तेजी से करना मतलब चरणों को छोड़ना नहीं है, बल्कि शुरुआत से अंत तक मार्ग को पुनर्परिभाषित करना है।"
उत्पन्न करने के लिए सशर्त मार्गदर्शन को लचीला बनाना
प्रारंभिक विधि का एक अन्य सीमितता उत्पन्न करने का मार्गदर्शन करने का उसका सिस्टम था। क्लासिफायर-रहित मार्गदर्शन का प्रशिक्षण के दौरान निश्चित स्केल था, जो नई नमूनों को उत्पादित करने में इसकी अनुकूलनशीलता को प्रतिबंधित करता था। नया दृष्टिकोण इसे स्पष्ट सशर्त चर के रूप में तैयार करके संबोधित करता है। यह उत्पन्न करने के समय विविध स्थितियों को लागू करने की अनुमति देता है, पूरी लचीलापन बनाए रखते हुए। ये स्थितियां संदर्भ में सशर्तीकरण तकनीक द्वारा संसाधित की जाती हैं, जो न केवल मॉडल को अधिक बहुमुखी बनाती है, बल्कि इसके कुल आकार को कम करती है और सामान्य प्रदर्शन में सुधार करती है।
नए मार्गदर्शन सिस्टम की विशेषताएं:- स्थितियां स्पष्ट चर हैं, निश्चित पैरामीटर नहीं।
- विविध जानकारी को कुशलता से संसाधित करने के लिए संदर्भ में सशर्तीकरण का उपयोग करता है।
- अधिक कॉम्पैक्ट मॉडल और बेहतर प्रदर्शन प्राप्त करता है।
iMF: बहु-चरण विधियों से प्रतिस्पर्धा करने वाला परिणाम
इन सुधारों का संयोजन iMF (Improved MeanFlow) का परिणाम देता है। इस मॉडल को शून्य से प्रशिक्षित किया गया और ImageNet 256x256 डेटासेट पर एकल फलन मूल्यांकन के साथ FID स्कोर 1.72 प्राप्त किया। यह परिणाम पूर्व एकल-चरण विधियों को पर्याप्त रूप से पार करता है और, जो अधिक उल्लेखनीय है, अंतर को कम करता है बहु-चरण या पुनरावृत्ति की आवश्यकता वाले जनरेटिव दृष्टिकोणों के साथ। यह सब मॉडल डिस्टिलेशन तकनीकों का उपयोग किए बिना प्राप्त किया जाता है, जो तेज प्रगति जनरेटिव मॉडलिंग को एक स्वतंत्र और शक्तिशाली पैराडाइम के रूप में मजबूत करता है। 🎯