Meanflow и IMF переопределяют генеративное моделирование в один шаг

Опубликовано 29.01.2026 | Перевод с испанского
Диаграмма архитектуры, сравнивающая исходный поток обучения MeanFlow с новой формулировкой iMF, показывающая сеть, предсказывающую среднюю скорость и кондиционирование в контексте, на фоне изображений высокого качества, сгенерированных.

Meanflow и imf переопределяют генеративное моделирование в один шаг

Область генеративного моделирования стремится создавать новые данные высокого качества, и скорость является ключевым фактором. MeanFlow появился как многообещающий фреймворк для генерации в один шаг, но его быстрое развитие создавало препятствия в стабильности. Теперь глубокая реформулировка его ядра породила iMF, отметив значительный прорыв. 🚀

Реформулировка цели для стабилизации обучения

Основная проблема заключалась в том, как обучать модель. Исходная цель зависела не только от реальных данных, но и от изменяющегося состояния самой нейронной сети, что усложняло процесс. Решение заключалось в переопределении этой цели как функции потерь, рассчитанной на мгновенную скорость. Для этого была введена вспомогательная сеть, предсказывающая среднюю скорость потока, позволяющая репараметризовать мгновенную скорость. Это изменение превращает проблему в более традиционную и прямую регрессию, что значительно стабилизирует цикл обучения.

Ключевые преимущества реформулировки:
  • Преобразует сложную проблему оптимизации в стандартную регрессию, более легкую в управлении.
  • Сеть, предсказывающая среднюю скорость, действует как стабилизирующий якорь во время обучения.
  • Позволяет модели сходиться более последовательно и с меньшими колебаниями.
"Иногда ускорение не значит пропускать шаги, а значит переопределить путь от начала до конца."

Гибкость условного руководства для генерации

Еще одним ограничением исходного метода была его система руководства генерацией. Руководство без классификатора имело фиксированный масштаб во время обучения, что ограничивало его адаптивность при создании новых образцов. Новый подход решает это, формулируя руководство как явные переменные кондиционирования. Это позволяет применять разнообразные условия во время генерации, сохраняя всю гибкость. Эти условия обрабатываются с помощью техники кондиционирования в контексте, которая не только делает модель более универсальной, но и уменьшает ее общий размер и улучшает общее производительность.

Характеристики новой системы руководства:
  • Условия являются явными переменными, а не фиксированными параметрами.
  • Использует кондиционирование в контексте для эффективной обработки разнообразной информации.
  • Достигает более компактной модели с лучшей производительностью.

iMF: Результат, конкурирующий с методами нескольких шагов

Сочетание этих улучшений приводит к iMF (Improved MeanFlow). Эта модель была обучена с нуля и, при оценке на наборе ImageNet 256x256 с одной оценкой функции, достигла показателя FID 1.72. Этот результат существенно превосходит предыдущие методы одного шага и, что особенно примечательно, сокращает разрыв с генеративными подходами, требующими нескольких шагов или итераций. Все это достигается без использования техник дистилляции моделей, укрепляя генеративное моделирование быстрого продвижения как независимую и мощную парадигму. 🎯