NVIDIA, DiffusionGemma için RTX ve DGX desteğini duyurdu

11 Haziran 2026

16

Google DeepMind, yeni açık yapay zekâ modeli DiffusionGemma’yı tanıttı. NVIDIA da modelin GeForce RTX, RTX PRO ve DGX ürün ailesi genelinde ilk günden tam destek aldığını açıkladı. Şirketin vurgusu, DiffusionGemma’nın yerel sistemlerde hızlı metin üretimi için tasarlanmış olması ve NVIDIA’nın tensor core mimarisi ile CUDA yazılım yığını sayesinde ek ayar gerektirmeden çalıştırılabilmesi.

DiffusionGemma’nın öne çıkan tarafı, klasik otoregresif yaklaşımda olduğu gibi token’ları tek tek üretmek yerine, her adımda 256 tokene kadar gürültü giderme temelli paralel üretim yapabilmesi. Model, Gemma 4 tabanı üzerine kuruluyor ve toplam 25.2B parametreye sahip. Her adımda etkin olarak kullanılan parametre miktarı ise 3.8B seviyesinde. Desteklenen kipler metin ve görüntü olarak verilirken, bağlam uzunluğu 256K token’a kadar çıkıyor. Hassasiyet tarafında BF16 ve NVFP4 desteği sunuluyor.

NVIDIA’ya göre bu yapı, özellikle tek kullanıcı senaryolarında yerel metin üretiminde belirgin hız avantajı sağlıyor. Şirket, DiffusionGemma’nın eşdeğer bir otoregresif modele kıyasla yaklaşık 4 kat daha yüksek performans sunabildiğini belirtiyor. Paylaşılan sayılara göre H100 Tensor Core GPU kullanan DGX Station sistemlerinde tek GPU ile 1000 tokens/s seviyesine ulaşılabiliyor. DGX Spark tarafında ise 150 tokens/s değeri veriliyor. Ayrı bir bölümde DGX Station için 800 tokens/s’ye kadar düşük gecikmeli metin üretimi ifadesi de yer alıyor.

The GeForce RTX graphics card is displayed between large letters 'RTX' and 'AI' with green light beams in the background.

Desteklenen sistemler arasında NVIDIA GB10 Grace Blackwell Superchip kullanan DGX Spark bulunuyor. Bu model 128GB birleşik bellek ile geliyor ve yerel prototipleme, ince ayar ve ajan tabanlı iş akışları için konumlandırılıyor. DGX Station ise NVIDIA GB300 Grace Blackwell Ultra Superchip, 748GB coherent memory ve 20 PFLOPS’a kadar FP4 hesaplama gücü ile daha üst seviye masaüstü yapay zekâ iş yüklerine odaklanıyor. NVIDIA, bu sistemin 1T parametreye kadar modelleri desteklediğini de belirtiyor.

Masaüstü tarafında GeForce RTX GPU’lar ve RTX PRO iş istasyonları da destek kapsamında. NVIDIA, profesyoneller ve geliştiriciler için düşük gecikmeli yerel üretim ve ajan döngülerinde optimize edilmiş performans sunduğunu söylüyor. Yazılım tarafında Hugging Face Transformers, vLLM ve Unsloth için ilk gün desteği mevcut. Ayrıca DiffusionGemma, Apache 2.0 lisansı altında açık ağırlıklarla sunuluyor. Modeli kutudan çıktığı gibi denemek isteyenler için RTX 5090 ve DGX Spark sistemleri hazır durumda; GeForce RTX tarafında llama.cpp desteğinin de yakında geleceği belirtiliyor.

Önceki İçerik

OpenBSD 7.9 çıktı: daha çok çekirdek ve temel Wi‑Fi 6 desteği

Sonraki İçerik

Intel Z990 ve Z970 yonga setlerinde güç tüketimi artıyor

Benzer İçerikler

NVIDIA, DiffusionGemma için RTX ve DGX desteğini duyurdu

AI Appreciation Day 16 Temmuz’da tartışmalı bir farkındalık günü

AMD sürücülerinde FSR MFG 8x ve yeni override seçenekleri

Lenovo Legion 7a, 12GB RTX 5070 seçeneğiyle yenilendi

Yorum Yap İptal

Haberler

Apple, M6 Pro ve M6 Max’ı atlayıp M7’ye odaklanabilir

AI Appreciation Day 16 Temmuz’da tartışmalı bir farkındalık günü

Bellek üreticileri AI talebinde yeni bir patlama-düşüş döngüsü yaşıyor

Pentagon yeni UAP dosyalarını açtı, Tianwen-2 hedefe ulaştı

Halo Studios yönetimi için kötü çalışma ortamı iddiaları

Son Yorumlar