Black Forest Labs представляет FLUX.2: новый претендент в генерации AI-изображений

2

Ландшафт генерации AI-изображений становится всё более насыщенным, но и более интересным. Немецкий стартап Black Forest Labs (BFL) выпустил FLUX.2, новый набор моделей изображений, предназначенный для прямой конкуренции с лидерами отрасли, такими как Gemini 3 (Nano Banana Pro) от Google, Midjourney и Claude Opus 4.5 от Anthropic. В то время как многие игроки выходят на рынок, FLUX.2 выделяется гибридным подходом: сочетанием коммерческих предложений со значительным компонентом с открытым исходным кодом.

Основа FLUX.2: Открытость и контроль

В релиз BFL входят четыре модели: FLUX.2 [Pro], [Flex], [Dev] и предстоящая [Klein]. Ключевым отличием является полностью открытый исходный код Flux.2 VAE (вариационный автоэнкодер), выпущенный под лицензией Apache 2.0. Это критически важно, поскольку VAE сжимает и реконструирует изображения, определяя базовое «латентное пространство», используемое всеми вариантами FLUX.2.

Почему это важно? Открытый VAE позволяет предприятиям интегрировать технологии BFL в свои внутренние системы без привязки к поставщику. Они могут использовать одно и то же латентное пространство в разных генераторах изображений, обеспечивая согласованность и упрощая рабочие процессы. Открытый VAE также поддерживает аудит, соответствие требованиям и потенциальную настройку для фирменного стиля.

Производительность и ценообразование: Конкурентное преимущество

FLUX.2 – это не только об открытости; речь идёт о производительности. Бенчмарки BFL показывают, что FLUX.2 [Dev] превосходит другие модели с открытым исходным кодом в генерации текста в изображение, редактировании по одной ссылке и редактировании по нескольким ссылкам.

  • Текст в изображение: 66.6% побед против Qwen-Image (51.3%) и Hunyuan Image 3.0 (48.1%).
  • Редактирование по одной ссылке: 59.8% против Qwen-Image (49.3%) и FLUX.1 Kontext (41.2%).
  • Редактирование по нескольким ссылкам: 63.6% против Qwen-Image (36.4%).

Ценообразование также агрессивное. FLUX.2 [Pro] стоит примерно $0.03 за мегапиксель, что значительно ниже, чем у Google’s Gemini 3 Pro Image Preview (Nano Banana Pro) – около $0.134–$0.24 за сопоставимое изображение. Это делает FLUX.2 привлекательным вариантом для рабочих процессов с высоким разрешением или несколькими изображениями.

Технические достижения: Больше, чем просто скорость

FLUX.2 построен на архитектуре FLUX.1 с несколькими ключевыми улучшениями:

  • Мульти-референсное обусловливание: Возможность использовать до десяти референсных изображений, сохраняя при этом согласованность в идентичности, продуктах или стиле.
  • Высококачественные результаты: Улучшенное качество и детализация изображения, позволяющие использовать такие варианты использования, как визуализация продукта и создание брендированного контента.
  • Улучшенная отрисовка текста: Более разборчивый текст на изображениях, открывающий возможности для элементов пользовательского интерфейса, инфографики и других визуальных элементов с большим количеством текста.

В основе FLUX.2 лежит архитектура латентного потокового соответствия с преобразователем исправленного потока и моделью языка зрения на основе Mistral-3 (24B). Переработанное латентное пространство достигает лучшего качества реконструкции без ущерба для обучаемости.

Рост BFL: От корней Stable Diffusion

Black Forest Labs была основана в 2024 году создателями Stable Diffusion (Robin Rombach, Patrick Esser и Andreas Blattmann). Компания привлекла $31 миллион посевного финансирования и продолжает позиционировать себя как мост между открытыми исследованиями и коммерческой надёжностью. Их стратегия открытого ядра, сочетающая проприетарные предложения с моделями с открытым исходным кодом, уже стимулировала внедрение в последующие продукты, такие как xAI’s Grok 2.

Выпуск FLUX.2 – это не просто запуск очередной AI-модели; это стратегический шаг, направленный на оспаривание доминирования закрытых систем, одновременно способствуя более доступной и настраиваемой экосистеме для генерации изображений.

Подход BFL сигнализирует о переходе к моделям, ориентированным на производство, которые отдают приоритет надёжности, контролю и интеграции в существующие творческие рабочие процессы. По мере созревания рынка генерации AI-изображений FLUX.2 готова стать одним из основных игроков, предлагая жизнеспособную альтернативу как проприетарным гигантам, так и фрагментированному ландшафту с открытым исходным кодом.