Генеративная перефокусировка корректирует плоскость фокуса из одного изображения

Опубликовано 28.01.2026 | Перевод с испанского
Diagrama o ejemplo visual que muestra una fotografía antes y después de aplicar Generative Refocusing, ilustrando el cambio en el plano de enfoque y el efecto bokeh generado.

Генеративная переналадка фокуса регулирует плоскость фокуса из одного изображения

Вычислительная фотография делает скачок с методами, которые позволяют переопределить фокус после захвата изображения. Generative Refocusing представляет этот прогресс, используя искусственный интеллект для манипуляции глубиной резкости и характерным размытием фона из единственного файла. 🎯

Архитектура из двух специализированных нейронных сетей

Система основана на архитектуре в две стадии, где каждая нейронная сеть выполняет различную и критическую функцию. Эта разделенность позволяет решать с большей точностью сложные оптические проблемы, связанные с симуляцией новой фокальной плоскости.

Основные компоненты рабочего процесса:
  • DeblurNet: Её задача — обработать входное фото для удаления нежелательной размытости, предоставляя полностью чёткую версию, которая служит идеальной основой.
  • BokehNet: Берёт прояснённое изображение и генерирует на нём эффект размытия высокого качества. Это размытие не фиксировано, а пользователь может интерактивно регулировать его параметры.
  • Полунадзорованное обучение: Модель учится, комбинируя большие объёмы синтетических данных с реальными фотографиями, содержащими метаданные EXIF, что учит её воспроизводить поведение физических объективов.
Разделение задачи прояснения изображения и применения размытия ключевое для достижения гибких и визуально точных результатов.

Расширенный контроль с помощью текста и пользовательских форм

Помимо традиционных числовых контролей, эта техника интегрирует интуитивные интерфейсы управления. Пользователи не ограничены ползунками, а могут направлять эффект с помощью естественного языка или определять эстетику размытия новыми способами.

Модальности творческого управления:
  • Управление текстом: Позволяет описывать желаемый тип эффекта словами (например, "мягкий и кремовый боке"). Система интерпретирует эту инструкцию для генерации соответствующего размытия.
  • Пользовательские формы диафрагмы: Поддерживает создание эффектов боке, не являющихся круговыми. Пользователи могут генерировать блики в форме звезды, шестиугольника или других узоров, имитируя результат специализированных диафрагм объективов.
  • Параметрическая регулировка: Кроме того, предлагает прямой контроль над интенсивностью размытия и позицией плоскости фокуса, обеспечивая техническую точность.

Последствия для постпродакшена фотографии

Этот метод значительно расширяет творческие возможности в редактировании. Больше не нужно захватывать несколько снимков с разными диафрагмами; глубина резкости становится полностью податливым элементом в постпродакшене. Позволяет исправлять ошибки фокусировки или, чаще, исследовать эстетические альтернативы, не рассмотренные в момент съёмки. Способность симулировать дорогие оптические системы или специфические эффекты только с помощью ПО демократизирует инструменты, ранее доступные только профессиональным студиям. 🔧