Krajina generování obrazu AI je stále přeplněnější, ale také zajímavější. Německý startup Black Forest Labs (BFL) vydal FLUX.2, novou sadu obrazových modelů navržených tak, aby přímo soutěžily s lídry v oboru, jako jsou Gemini 3 (Nano Banana Pro) od Googlu, Midjourney a Claude Opus 4.5 od Anthropic. Zatímco na trh vstupuje mnoho hráčů, FLUX.2 vyniká svým hybridním přístupem: kombinuje komerční nabídky s významnou open source komponentou.
FLUX.2 Foundation: Otevřenost a kontrola
Vydání BFL obsahuje čtyři modely: FLUX.2 [Pro], [Flex], [Dev] a nadcházející [Klein]. Klíčovým rozdílem je plně open source Flux.2 VAE (variační autoencoder), vydaný pod licencí Apache 2.0. To je kritické, protože VAE komprimuje a rekonstruuje obrazy, čímž definuje základní „latentní prostor“ používaný všemi variantami FLUX.2.
Proč je to důležité? Open VAE umožňuje podnikům integrovat technologie BFL do svých interních systémů bez uzamčení dodavatele. Mohou sdílet stejný latentní prostor napříč různými generátory obrázků, což zajišťuje konzistenci a zjednodušuje pracovní postupy. Open VAE také podporuje audit, shodu a potenciální přizpůsobení pro branding.
Výkon a cena: Konkurenční výhoda
FLUX.2 není jen o otevřenosti; jde o výkon. BFL benchmarky ukazují, že FLUX.2 [Dev] překonává ostatní modely s otevřeným zdrojovým kódem v generování textu na obrázek, úpravách s jedním odkazem a úpravách s více odkazy.
- Text na obrázek: Míra výher 66,6 % oproti Qwen-Image (51,3 %) a Hunyuan Image 3.0 (48,1 %).
- Úprava jednoho odkazu: 59,8 % vs. Qwen-Image (49,3 %) a FLUX.1 Kontext (41,2 %).
- Vícenásobné úpravy odkazů: 63,6 % oproti Qwen-Image (36,4 %).
Agresivní je i cena. FLUX.2 [Pro] stojí přibližně 0,03 $ za megapixel, což je výrazně méně než náhled obrázku Gemini 3 Pro od Googlu (Nano Banana Pro) – asi 0,134 – 0,24 $ za srovnatelný obrázek. Díky tomu je FLUX.2 atraktivní volbou pro pracovní postupy s vysokým rozlišením nebo s více obrázky.
Technické úspěchy: Více než jen rychlost
FLUX.2 je postaven na architektuře FLUX.1 s několika klíčovými vylepšeními:
- Multi-Reference Conditioning: Možnost použít až deset referenčních obrázků při zachování konzistence identity, produktů nebo stylu.
- Výsledky vysoké kvality: Vylepšená kvalita obrazu a detailů umožňující případy použití, jako je vizualizace produktu a tvorba značkového obsahu.
- Vylepšené vykreslování textu: Čitelnější text v obrázcích, otevírá možnosti pro prvky uživatelského rozhraní, infografiku a další vizuály s vysokým obsahem textu.
FLUX.2 je založen na architektuře latentního přizpůsobení proudu s opraveným transformátorem proudu a modelem jazyka vidění založeném na Mistral-3 (24B). Přepracovaný latentní prostor dosahuje lepší kvality rekonstrukce bez obětování schopnosti učení.
Růst BFL: Od kořenů stabilní difúze
Black Forest Labs byla založena v roce 2024 tvůrci Stable Diffusion (Robin Rombach, Patrick Esser a Andreas Blattmann). Společnost získala 31 milionů dolarů v počátečním financování a nadále se staví jako most mezi otevřeným výzkumem a komerční důvěryhodností. Jejich strategie otevřeného jádra, která kombinuje proprietární nabídky s modely s otevřeným zdrojovým kódem, již podnítila přijetí v následujících produktech, jako je Grok 2 od xAI.
Vydání FLUX.2 není jen uvedením dalšího modelu umělé inteligence; je to strategický krok, který má zpochybnit dominanci uzavřených systémů a zároveň podporovat přístupnější a přizpůsobitelnější zobrazovací ekosystém.
Přístup BFL signalizuje posun směrem k modelům zaměřeným na produkci, které upřednostňují spolehlivost, kontrolu a integraci do stávajících kreativních pracovních postupů. Jak trh generování obrazu AI dozrává, FLUX.2 je připraven stát se významným hráčem, který nabízí životaschopnou alternativu jak proprietárním gigantům, tak fragmentovanému open source prostředí.






























































