Ana SayfaEkran KartıNVIDIA, DiffusionGemma için RTX ve DGX desteğini duyurdu

NVIDIA, DiffusionGemma için RTX ve DGX desteğini duyurdu

Google DeepMind, yeni açık yapay zekâ modeli DiffusionGemma’yı tanıttı. NVIDIA da modelin GeForce RTX, RTX PRO ve DGX ürün ailesi genelinde ilk günden tam destek aldığını açıkladı. Şirketin vurgusu, DiffusionGemma’nın yerel sistemlerde hızlı metin üretimi için tasarlanmış olması ve NVIDIA’nın tensor core mimarisi ile CUDA yazılım yığını sayesinde ek ayar gerektirmeden çalıştırılabilmesi.

DiffusionGemma’nın öne çıkan tarafı, klasik otoregresif yaklaşımda olduğu gibi token’ları tek tek üretmek yerine, her adımda 256 tokene kadar gürültü giderme temelli paralel üretim yapabilmesi. Model, Gemma 4 tabanı üzerine kuruluyor ve toplam 25.2B parametreye sahip. Her adımda etkin olarak kullanılan parametre miktarı ise 3.8B seviyesinde. Desteklenen kipler metin ve görüntü olarak verilirken, bağlam uzunluğu 256K token’a kadar çıkıyor. Hassasiyet tarafında BF16 ve NVFP4 desteği sunuluyor.

NVIDIA’ya göre bu yapı, özellikle tek kullanıcı senaryolarında yerel metin üretiminde belirgin hız avantajı sağlıyor. Şirket, DiffusionGemma’nın eşdeğer bir otoregresif modele kıyasla yaklaşık 4 kat daha yüksek performans sunabildiğini belirtiyor. Paylaşılan sayılara göre H100 Tensor Core GPU kullanan DGX Station sistemlerinde tek GPU ile 1000 tokens/s seviyesine ulaşılabiliyor. DGX Spark tarafında ise 150 tokens/s değeri veriliyor. Ayrı bir bölümde DGX Station için 800 tokens/s’ye kadar düşük gecikmeli metin üretimi ifadesi de yer alıyor.

The GeForce RTX graphics card is displayed between large letters 'RTX' and 'AI' with green light beams in the background.

Desteklenen sistemler arasında NVIDIA GB10 Grace Blackwell Superchip kullanan DGX Spark bulunuyor. Bu model 128GB birleşik bellek ile geliyor ve yerel prototipleme, ince ayar ve ajan tabanlı iş akışları için konumlandırılıyor. DGX Station ise NVIDIA GB300 Grace Blackwell Ultra Superchip, 748GB coherent memory ve 20 PFLOPS’a kadar FP4 hesaplama gücü ile daha üst seviye masaüstü yapay zekâ iş yüklerine odaklanıyor. NVIDIA, bu sistemin 1T parametreye kadar modelleri desteklediğini de belirtiyor.

Masaüstü tarafında GeForce RTX GPU’lar ve RTX PRO iş istasyonları da destek kapsamında. NVIDIA, profesyoneller ve geliştiriciler için düşük gecikmeli yerel üretim ve ajan döngülerinde optimize edilmiş performans sunduğunu söylüyor. Yazılım tarafında Hugging Face Transformers, vLLM ve Unsloth için ilk gün desteği mevcut. Ayrıca DiffusionGemma, Apache 2.0 lisansı altında açık ağırlıklarla sunuluyor. Modeli kutudan çıktığı gibi denemek isteyenler için RTX 5090 ve DGX Spark sistemleri hazır durumda; GeForce RTX tarafında llama.cpp desteğinin de yakında geleceği belirtiliyor.

HWM
HWMhttps://hardwaremania.com
Yoda is a revered former Jedi Master who spent the last years of his life on Dagobah. The nine-hundred-year-old Jedi master trained Jedi knights for eight centuries.
Benzer İçerikler

Haberler

- Advertisment -

Son Yorumlar

- Advertisment -