Black Forest Labs lancia FLUX.2: un nuovo contendente nella generazione di immagini AI

19

Il panorama della generazione di immagini tramite intelligenza artificiale è diventato più affollato, ma anche più interessante. La startup tedesca Black Forest Labs (BFL) ha rilasciato FLUX.2, una nuova suite di modelli di immagine progettati per competere direttamente con leader del settore come Gemini 3 (Nano Banana Pro) di Google, Midjourney e Claude Opus 4.5 di Anthropic. Mentre molti attori stanno entrando nel mercato, FLUX.2 si distingue per un approccio ibrido: combinando offerte commerciali con una significativa componente open source.

Il nucleo di FLUX.2: apertura e controllo

La versione di BFL include quattro modelli: FLUX.2 [Pro], [Flex], [Dev] e il prossimo [Klein]. L’elemento chiave di differenziazione è il Flux.2 VAE completamente open source (codificatore automatico variazionale), rilasciato sotto la licenza Apache 2.0. Questo è fondamentale perché il VAE comprime e ricostruisce le immagini, definendo lo “spazio latente” sottostante utilizzato da tutte le varianti FLUX.2.

Perché è importante? Una VAE aperta consente alle aziende di integrare la tecnologia di BFL con i propri sistemi interni senza vincoli al fornitore. Possono utilizzare lo stesso spazio latente su diversi generatori di immagini, garantendo coerenza e semplificando i flussi di lavoro. Il VAE aperto supporta anche la verificabilità, la conformità e la potenziale personalizzazione per gli stili del marchio.

Prestazioni e prezzi: un vantaggio competitivo

FLUX.2 non è solo una questione di apertura; è una questione di prestazioni. I benchmark di BFL mostrano che FLUX.2 [Dev] supera gli altri modelli open-weight nella generazione di testo in immagine, nell’editing a riferimento singolo e nell’editing a riferimento multiplo.

  • Da testo a immagine: tasso di vincita del 66,6% rispetto a Qwen-Image (51,3%) e Hunyuan Image 3.0 (48,1%).
  • Modifica di riferimenti singoli: 59,8% rispetto a Qwen-Image (49,3%) e FLUX.1 Kontext (41,2%).
  • Modifica multi-riferimento: 63,6% rispetto a Qwen-Image (36,4%).

Anche i prezzi sono aggressivi. FLUX.2 [Pro] costa circa $ 0,03 per megapixel, significativamente inferiore all’anteprima immagine Gemini 3 Pro di Google (Nano Banana Pro) a circa $ 0,134–$ 0,24 per immagine comparabile. Ciò rende FLUX.2 un’opzione interessante per flussi di lavoro ad alta risoluzione o multi-immagine.

Progressi tecnici: oltre la velocità

FLUX.2 si basa sull’architettura FLUX.1 con diversi miglioramenti chiave:

  • Condizionamento multi-riferimento: la possibilità di utilizzare fino a dieci immagini di riferimento mantenendo la coerenza nell’identità, nei prodotti o nello stile.
  • Uscite ad alta fedeltà: Qualità e dettaglio delle immagini migliorati, consentendo casi d’uso come la visualizzazione del prodotto e la creazione di contenuti brandizzati.
  • Rendering del testo migliorato: Testo più leggibile nelle immagini, aprendo possibilità per elementi dell’interfaccia utente, infografiche e altri elementi visivi ricchi di testo.

Sotto il cofano, FLUX.2 utilizza un’architettura di adattamento del flusso latente con un trasformatore di flusso rettificato e un modello di linguaggio visivo basato su Mistral-3 (24B). Lo spazio latente riprogettato raggiunge una migliore qualità di ricostruzione senza sacrificare l’apprendimento.

L’ascesa di BFL: dalle radici della diffusione stabile

Black Forest Labs è stata fondata nel 2024 dai creatori di Stable Diffusion (Robin Rombach, Patrick Esser e Andreas Blattmann). L’azienda si è assicurata 31 milioni di dollari in finanziamenti iniziali e continua a posizionarsi come un ponte tra la ricerca aperta e l’affidabilità commerciale. La loro strategia open-core, che combina offerte proprietarie con modelli open-weight, ha già favorito l’adozione in prodotti downstream come Grok 2 di xAI.

Il rilascio di FLUX.2 non è solo l’ennesimo lancio di un modello di intelligenza artificiale; è una mossa strategica per sfidare il dominio dei sistemi closed-source, promuovendo al contempo un ecosistema più accessibile e personalizzabile per la generazione di immagini.

L’approccio di BFL segnala uno spostamento verso modelli incentrati sulla produzione che danno priorità all’affidabilità, al controllo e all’integrazione nei flussi di lavoro creativi esistenti. Con la maturazione del mercato della generazione di immagini AI, FLUX.2 è pronto a diventare un attore importante, offrendo una valida alternativa sia ai giganti proprietari che al frammentato panorama open source.