Meanflow und IMF definieren das generative Modellieren in einem Schritt neu

Veröffentlicht am 21. January 2026 | Aus dem Spanischen übersetzt
Diagrama de arquitectura que compara el flujo de entrenamiento original de MeanFlow con la nueva formulación iMF, mostrando la red que predice la velocidad media y el condicionamiento en contexto, sobre un fondo de imágenes generadas de alta calidad.

Meanflow und imf definieren das generative Modellieren in einem Schritt neu

Das Feld des generativen Modellierens strebt die Erstellung neuer Daten hoher Qualität an, und die Geschwindigkeit ist ein Schlüsselfaktor. MeanFlow entstand als vielversprechendes Framework für die Generierung in einem einzigen Schritt, aber seine schnell fortschreitende Natur stellte Hindernisse für die Stabilität dar. Nun hat eine tiefgreifende Reformulierung seines Kerns iMF das Licht der Welt gebracht und markiert einen bedeutenden Meilenstein. 🚀

Das Ziel reformulieren, um das Training zu stabilisieren

Das Hauptproblem lag in der Art und Weise, wie das Modell trainiert wurde. Das ursprüngliche Ziel hing nicht nur von den realen Daten ab, sondern auch vom sich ändernden Zustand des neuronalen Netzwerks selbst, was den Prozess komplizierte. Die Lösung bestand darin, dieses Ziel neu zu definieren als eine Verlustfunktion, die auf der instantanen Geschwindigkeit berechnet wird. Um dies zu erreichen, wurde ein Hilfsnetzwerk eingeführt, das die Mittelgeschwindigkeit des Flusses vorhersagt und eine Reparametrisierung der instantanen Geschwindigkeit ermöglicht. Dieser Wechsel verwandelt das Problem in eine konventionellere und direktere Regression, was den Trainingszyklus enorm stabilisiert.

Schlüssige Vorteile der Reformulierung:
  • Verwandelt ein komplexes Optimierungsproblem in eine standardmäßige Regression, die einfacher zu handhaben ist.
  • Das Netzwerk, das die Mittelgeschwindigkeit vorhersagt, wirkt als stabilisierender Anker während des Trainings.
  • Ermöglicht, dass das Modell konstanter konvergiert und mit weniger Schwankungen.
"Manchmal bedeutet, Dinge schneller zu machen, nicht Schritte zu überspringen, sondern den Weg von Anfang bis Ende neu zu definieren."

Die bedingte Führung flexibler gestalten für die Generierung

Ein weiteres Limit des anfänglichen Verfahrens war sein System zur Führung der Generierung. Die klassifikatorfreie Führung hatte eine feste Skala während des Trainings, was ihre Anpassungsfähigkeit bei der Erzeugung neuer Proben einschränkte. Der neue Ansatz löst dies, indem er die Führung als explizite Bedingungsvariablen formuliert. Dies ermöglicht die Anwendung vielfältiger Bedingungen zur Generierungszeit und bewahrt die gesamte Flexibilität. Diese Bedingungen werden durch eine Technik des Kontextkonditionierens verarbeitet, die das Modell nicht nur vielseitiger macht, sondern auch seine Gesamtgröße reduziert und die allgemeine Leistung verbessert.

Merkmale des neuen Führungssystems:
  • Die Bedingungen sind explizite Variablen, keine festen Parameter.
  • Verwendet Kontextkonditionierung, um vielfältige Informationen effizient zu verarbeiten.
  • Erreicht ein kompakteres Modell mit besserer Leistung.

iMF: Ein Ergebnis, das mit Mehrschritt-Methoden konkurriert

Die Kombination dieser Verbesserungen ergibt iMF (Improved MeanFlow). Dieses Modell wurde von Grund auf trainiert und erreichte bei der Bewertung auf dem Datensatz ImageNet 256x256 mit einer einzigen Funktionsauswertung einen FID-Wert von 1.72. Dieses Ergebnis übertrifft andere vorherige Einzelschritt-Methoden erheblich und, was noch bemerkenswerter ist, verkleinert die Lücke zu generativen Ansätzen, die mehrere Schritte oder Iterationen erfordern. All dies wird ohne den Einsatz von Modell-Destillations-Techniken erreicht und festigt das generative Modellieren mit schnellem Fortschritt als unabhängiges und leistungsfähiges Paradigma. 🎯