Perşembe günü, AI-startup Black Forest Labs şirketinin lansmanını ve FLUX.1 adlı ilk metinden görüntüye AI modelleri paketinin yayınlandığını duyurdu.
Stable Diffusion’ın arkasındaki teknolojiyi geliştiren ve Latent Diffusion tekniğini icat eden araştırmacılar tarafından kurulan Almanya merkezli şirket, görüntüler ve videolar için gelişmiş üretken AI yaratmayı amaçlıyor. FLUX.1’in lansmanı, Stability AI’nın Haziran ortasında Stable Diffusion 3 Medium’un sorunlu lansmanından yaklaşık yedi hafta sonra geldi . Stability AI’nın sunduğu ürün, insan anatomisini oluşturmadaki zayıf performansı nedeniyle görüntü sentezi meraklıları arasında yaygın eleştirilerle karşı karşıya kaldı ve kullanıcılar sosyal medyada çarpık uzuvlar ve vücut örnekleri paylaştı. Bu sorunlu lansman, Stability AI’dan üç önemli mühendisin daha önce ayrılmasının ardından gerçekleşti: Robin Rombach, Andreas Blattmann ve Dominik Lorenz. Lorenz, daha sonra gizli difüzyon ortak geliştiricisi Patrick Esser ve diğerleriyle birlikte Black Forest Labs’ı kurdu.
Black Forest Labs, üç FLUX.1 metin-görüntü modelinin piyasaya sürülmesiyle faaliyete geçti: üst düzey ticari “pro” versiyonu, ticari olmayan kullanım için açık ağırlıklara sahip orta düzey “dev” versiyonu ve daha hızlı açık ağırlıklara sahip “schnell” versiyonu (“schnell” Almanca’da hızlı veya çabuk anlamına gelir). Black Forest Labs, modellerinin görüntü kalitesi ve metin istemlerine uyum gibi alanlarda Midjourney ve DALL-E gibi mevcut seçeneklerden daha iyi performans gösterdiğini iddia ediyor.
FLUX.1 modelleri, şirketin “hibrit mimari” olarak adlandırdığı, transformatör ve difüzyon tekniklerini birleştiren ve 12 milyar parametreye kadar ölçeklendirilen bir mimari kullanıyor. Black Forest Labs, akış eşleştirme ve diğer optimizasyonları dahil ederek önceki difüzyon modellerini geliştirdiğini söyledi.
FLUX.1, insan elleri üretmede yetenekli görünüyor, bu da Stable Diffusion 1.5 gibi daha önceki görüntü sentezleme modellerinde ellere odaklanan eğitim görüntülerinin eksikliği nedeniyle zayıf bir noktaydı . O ilk günlerden beri, Midjourney gibi diğer AI görüntü oluşturucuları da ellerde ustalaştı, ancak çeşitli pozlarda elleri nispeten doğru bir şekilde işleyen açık ağırlıklar modeli görmek dikkat çekici.