मीनफ्लो और आईएमएफ एकल-चरण जनरेटिव मॉडलिंग को पुनर्परिभाषित करते हैं

2026 February 08 | स्पेनिश से अनुवादित
Diagrama de arquitectura que compara el flujo de entrenamiento original de MeanFlow con la nueva formulación iMF, mostrando la red que predice la velocidad media y el condicionamiento en contexto, sobre un fondo de imágenes generadas de alta calidad.

Meanflow और imf एकल-चरण जनरेटिव मॉडलिंग को फिर से परिभाषित करते हैं

जनरेटिव मॉडलिंग क्षेत्र उच्च गुणवत्ता वाले नए डेटा बनाने का प्रयास करता है, और गति एक प्रमुख कारक है। MeanFlow एकल-चरण में उत्पन्न करने के लिए एक आशाजनक फ्रेमवर्क के रूप में उभरा, लेकिन इसकी तेज प्रगति की प्रकृति ने स्थिरता में बाधाएं पैदा कीं। अब, इसके कोर की गहन पुनर्संरचना ने iMF को जन्म दिया है, जो एक महत्वपूर्ण मील का पत्थर है। 🚀

प्रशिक्षण को स्थिर करने के लिए उद्देश्य को पुनर्संरचित करना

मुख्य समस्या मॉडल को प्रशिक्षित करने के तरीके में थी। मूल उद्देश्य न केवल वास्तविक डेटा पर निर्भर था, बल्कि न्यूरल नेटवर्क के बदलते राज्य पर भी, जो प्रक्रिया को जटिल बनाता था। समाधान था इस उद्देश्य को पुनर्परिभाषित करना तात्कालिक वेग पर गणना की गई हानि फलन के रूप में। इसे प्राप्त करने के लिए, प्रवाह के औसत वेग की भविष्यवाणी करने वाली एक सहायक नेटवर्क पेश की गई, जो तात्कालिक वेग को पुनःपरामर्शित करने की अनुमति देती है। यह परिवर्तन समस्या को अधिक पारंपरिक और सीधे प्रतिगमन में बदल देता है, जो प्रशिक्षण चक्र को बहुत स्थिर करता है।

पुनर्संरचना के प्रमुख लाभ:
"कभी-कभी, चीजों को तेजी से करना मतलब चरणों को छोड़ना नहीं है, बल्कि शुरुआत से अंत तक मार्ग को पुनर्परिभाषित करना है।"

उत्पन्न करने के लिए सशर्त मार्गदर्शन को लचीला बनाना

प्रारंभिक विधि का एक अन्य सीमितता उत्पन्न करने का मार्गदर्शन करने का उसका सिस्टम था। क्लासिफायर-रहित मार्गदर्शन का प्रशिक्षण के दौरान निश्चित स्केल था, जो नई नमूनों को उत्पादित करने में इसकी अनुकूलनशीलता को प्रतिबंधित करता था। नया दृष्टिकोण इसे स्पष्ट सशर्त चर के रूप में तैयार करके संबोधित करता है। यह उत्पन्न करने के समय विविध स्थितियों को लागू करने की अनुमति देता है, पूरी लचीलापन बनाए रखते हुए। ये स्थितियां संदर्भ में सशर्तीकरण तकनीक द्वारा संसाधित की जाती हैं, जो न केवल मॉडल को अधिक बहुमुखी बनाती है, बल्कि इसके कुल आकार को कम करती है और सामान्य प्रदर्शन में सुधार करती है।

नए मार्गदर्शन सिस्टम की विशेषताएं:

iMF: बहु-चरण विधियों से प्रतिस्पर्धा करने वाला परिणाम

इन सुधारों का संयोजन iMF (Improved MeanFlow) का परिणाम देता है। इस मॉडल को शून्य से प्रशिक्षित किया गया और ImageNet 256x256 डेटासेट पर एकल फलन मूल्यांकन के साथ FID स्कोर 1.72 प्राप्त किया। यह परिणाम पूर्व एकल-चरण विधियों को पर्याप्त रूप से पार करता है और, जो अधिक उल्लेखनीय है, अंतर को कम करता है बहु-चरण या पुनरावृत्ति की आवश्यकता वाले जनरेटिव दृष्टिकोणों के साथ। यह सब मॉडल डिस्टिलेशन तकनीकों का उपयोग किए बिना प्राप्त किया जाता है, जो तेज प्रगति जनरेटिव मॉडलिंग को एक स्वतंत्र और शक्तिशाली पैराडाइम के रूप में मजबूत करता है। 🎯