Black Forest Labs lança FLUX.2: um novo concorrente na geração de imagens de IA

5

O cenário de geração de imagens de IA ficou mais lotado, mas também mais interessante. A startup alemã Black Forest Labs (BFL) lançou FLUX.2, um novo conjunto de modelos de imagem projetados para competir diretamente com líderes do setor como Gemini 3 (Nano Banana Pro) do Google, Midjourney e Claude Opus 4.5 da Anthropic. Embora muitos intervenientes estejam a entrar no mercado, o FLUX.2 distingue-se através de uma abordagem híbrida: combinando ofertas comerciais com uma componente significativa de código aberto.

O Núcleo do FLUX.2: Abertura e Controle

O lançamento da BFL inclui quatro modelos: FLUX.2 [Pro], [Flex], [Dev] e o próximo [Klein]. O principal diferencial é o Flux.2 VAE (autoencoder variacional) totalmente de código aberto, lançado sob a licença Apache 2.0. Isto é crítico porque o VAE comprime e reconstrói imagens, definindo o “espaço latente” subjacente usado por todas as variantes do FLUX.2.

Por que isso importa? Um VAE aberto permite que as empresas integrem a tecnologia da BFL com seus sistemas internos sem dependência de fornecedor. Eles podem usar o mesmo espaço latente em diferentes geradores de imagens, garantindo consistência e simplificando os fluxos de trabalho. O VAE aberto também oferece suporte à auditabilidade, conformidade e personalização potencial para estilos de marca.

Desempenho e preços: uma vantagem competitiva

FLUX.2 não trata apenas de abertura; trata-se de desempenho. Os benchmarks da BFL mostram que o FLUX.2 [Dev] supera outros modelos de peso aberto na geração de texto para imagem, edição de referência única e edição de múltiplas referências.

  • Texto para imagem: taxa de vitória de 66,6% vs. Qwen-Image (51,3%) e Hunyuan Image 3.0 (48,1%).
  • Edição de referência única: 59,8% vs. Qwen-Image (49,3%) e FLUX.1 Kontext (41,2%).
  • Edição multi-referência: 63,6% vs. Qwen-Image (36,4%).

O preço também é agressivo. O FLUX.2 [Pro] custa aproximadamente US$ 0,03 por megapixel, significativamente inferior ao Gemini 3 Pro Image Preview do Google (Nano Banana Pro), que custa aproximadamente US$ 0,134 a US$ 0,24 por imagem comparável. Isso torna o FLUX.2 uma opção atraente para fluxos de trabalho de alta resolução ou com várias imagens.

Avanços técnicos: além da velocidade

FLUX.2 baseia-se na arquitetura FLUX.1 com várias melhorias importantes:

  • Condicionamento de múltiplas referências: A capacidade de usar até dez imagens de referência, mantendo a consistência na identidade, nos produtos ou no estilo.
  • Saídas de maior fidelidade: Qualidade de imagem e detalhes aprimorados, permitindo casos de uso como visualização de produtos e criação de conteúdo de marca.
  • Renderização de texto aprimorada: Texto mais legível em imagens, abrindo possibilidades para elementos de interface do usuário, infográficos e outros recursos visuais com muito texto.

Nos bastidores, o FLUX.2 usa uma arquitetura de correspondência de fluxo latente com um transformador de fluxo retificado e um modelo de linguagem de visão baseado em Mistral-3 (24B). O espaço latente redesenhado alcança melhor qualidade de reconstrução sem sacrificar a capacidade de aprendizagem.

Ascensão do BFL: a partir de raízes de difusão estáveis

O Black Forest Labs foi fundado em 2024 pelos criadores do Stable Diffusion (Robin Rombach, Patrick Esser e Andreas Blattmann). A empresa garantiu US$ 31 milhões em financiamento inicial e continua a se posicionar como uma ponte entre a pesquisa aberta e a confiabilidade comercial. Sua estratégia de núcleo aberto, combinando ofertas proprietárias com modelos de peso aberto, já impulsionou a adoção de produtos downstream como o Grok 2 da xAI.

O lançamento do FLUX.2 não é apenas mais um lançamento de modelo de IA; é um movimento estratégico para desafiar o domínio dos sistemas de código fechado e, ao mesmo tempo, promover um ecossistema mais acessível e personalizável para geração de imagens.

A abordagem da BFL sinaliza uma mudança em direção a modelos centrados na produção que priorizam confiabilidade, controle e integração em fluxos de trabalho criativos existentes. À medida que o mercado de geração de imagens de IA amadurece, o FLUX.2 está preparado para ser um player importante, oferecendo uma alternativa viável tanto para gigantes proprietários quanto para o cenário fragmentado de código aberto.