NVIDIA, yapay zekâ tarafında yalnızca donanımla değil, model geliştirme cephesinde de iddiasını güçlendirmeye devam ediyor. wccftech’in aktardığına göre şirketin açık kaynak Nemotron 3 Super modeli, EnterpriseOps-Gym liderlik tablosunda birinci sıraya yükseldi. Böylece model; Kimi-K2.5, DeepSeek v3.2 ve GPT-OSS-120B gibi güçlü rakiplerin önüne geçmiş oldu.

Nemotron 3 Super, NVIDIA tarafından bu yılın mart ayında tanıtılmıştı. Model 120B büyüklüğünde ve 12B aktif parametre kullanıyor. NVIDIA’nın açıklamasına göre hibrit MoE mimarisine dayanan bu yapı, önceki Nemotron Super nesline kıyasla 5x daha yüksek throughput hedefliyor. Modelin bir diğer dikkat çekici yönü ise yerel 1M-token context window sunması. Bu da özellikle uzun bağlam takibi, ajan tabanlı iş akışları ve daha tutarlı çok adımlı akıl yürütme senaryolarında önemli bir avantaj anlamına geliyor.
Teknik tarafta modelin öne çıkan birkaç temel özelliği var. Latent MoE yaklaşımı, token’ları uzman katmanlara ulaşmadan önce sıkıştırarak aynı çıkarım maliyetinde 4x daha fazla uzmanı devreye sokabiliyor. Multi-token prediction ise tek bir forward pass içinde birden fazla gelecekteki token’ı tahmin ederek uzun çıktılarda üretim süresini azaltıyor. NVIDIA ayrıca hibrit Mamba-Transformer omurgasının, Mamba’nın dizi verimliliğini Transformer’ın hassas muhakeme kabiliyetiyle birleştirdiğini söylüyor.
Donanım-yazılım entegrasyonu açısından en kritik detaylardan biri de NVFP4 ön eğitim yaklaşımı. Bu yapı Blackwell mimarisi için optimize edilmiş durumda ve NVIDIA’ya göre NVIDIA B200 üzerinde, FP8 kullanan NVIDIA H100’e kıyasla 4x daha hızlı inference sağlarken bellek gereksinimini de anlamlı biçimde düşürüyor. Şirket, doğruluğun da korunduğunu belirtiyor. Buna ek olarak model, NVIDIA NeMo Gym ve NeMo RL altyapısıyla 21 farklı ortam yapılandırmasında reinforcement learning sonrası eğitimden geçirilmiş; eğitim sürecinde 1.2 milyondan fazla environment rollout kullanılmış.
EnterpriseOps-Gym kıyaslaması da sıradan bir benchmark değil. Test, 1.150 görev ve 512 işlevsel araç içeren tamamen etkileşimli ortamlarda modellerin başarımını ölçüyor. Amaç, ajanların bir iş akışını tamamlamak için birden fazla kurumsal sistemi ve aracı koordine edip edemediğini görmek. Bu yönüyle ölçüm, klasik metin tamamlama veya salt soru-cevap testlerinden daha gerçek kullanım senaryolarına yakın duruyor.
Sonuç tarafında Nemotron 3 Super, açık kaynak model tablosunda ortalama 27.3 puan alarak zirveye yerleşmiş durumda. Model özellikle TEAMS, Email ve Hybrid iş akışlarında liderlik gösterirken; CSM, ITSM ve Drive kategorilerinde de rekabetçi kalıyor. Oracle Mode tablosunda ise görev başarı oranı %44.3 olarak listelenmiş.
Bu tablo, NVIDIA’nın “tam AI yığını” stratejisini daha görünür hale getiriyor. Şirket bir yandan Blackwell tabanlı hızlandırıcılarla donanım tarafını domine etmeye çalışırken, diğer yandan Nano, Super ve Ultra’dan oluşan Nemotron 3 ailesiyle yazılım katmanını da güçlendiriyor. Özellikle kurumsal ajanlar, uzun bağlam işleme ve araç kullanımı gibi alanlarda alınan bu tür sonuçlar, NVIDIA’nın sadece GPU sağlayıcısı değil, uçtan uca AI platform tedarikçisi olma hedefini destekliyor.

