Morgan Stanley’nin değerlendirmesine göre NVIDIA’nın Blackwell tabanlı AI GPU’ları, veri merkezi kurulum maliyeti açısından Amazon ve Google’ın özel AI ASIC çözümlerine kıyasla daha pahalı kalsa da enerji verimliliğinde önemli bir avantaj sunuyor. Banka, 1 gigawatt kapasiteli bir veri merkezinin NVIDIA Blackwell GPU’larıyla kurulmasının, Google TPU veya Amazon Trainium tabanlı benzer bir tesise göre yaklaşık iki kat daha yüksek sermaye harcaması gerektirdiğini belirtiyor.
Buna karşın raporda, toplam harcamanın daha yüksek olmasının tek başına belirleyici olmadığı vurgulanıyor. Morgan Stanley’nin hesaplamalarına göre NVIDIA çözümleri, performans başına Watt tarafında özel AI ASIC’lere göre “2x-8x” daha önde yer alabiliyor. Buradaki temel ölçüt TFLOPS per Watt, yani Watt başına trilyon kayan nokta işlemi performansı.
Karşılaştırma tablosunda NVIDIA tarafında Vera Rubin (FP4), Vera Rubin (FP8), GB300 (FP8) ve H100 (FP8) yer alıyor. En yüksek skor 19.5 ile Vera Rubin (FP4) modeline ait. Diğer NVIDIA yongalarının skorları ise sırasıyla 6.8, 6.0 ve 3.1 olarak veriliyor. Bu tablo, özellikle yeni nesil Rubin mimarisinin verimlilik tarafında şirketin önceki nesillerine göre kayda değer bir sıçrama hedeflediğini gösteriyor.
Google ve Amazon’un özel çözümlerinde ise Google TPUv7 (FP8) için 4.3, Amazon Trn3 (FP8) içinse 2.5 TFLOPS per Watt değeri paylaşılıyor. Bu sonuçlar, TPUv7’yi Blackwell ile Hopper nesilleri arasına yerleştirirken, Trn3’ü bazı senaryolarda Hopper seviyesinin de gerisine düşürüyor.

Öte yandan sektörde değerlendirme kriterleri yalnızca ham performans ve Watt başına verimlilikle sınırlı değil. AI altyapı sağlayıcısı Nebius’tan aktarılan görüşe göre kullanıcılar artık GPU saatlik çalışma maliyetinin yanı sıra üretilen milyon token başına maliyete de bakıyor. Bu ölçümde Groq çözümlerinin token başına 5 ila 10 cent aralığında olduğu, NVIDIA Blackwell tarafında ise bunun 25 cent seviyesinde bulunduğu ifade ediliyor.
Aynı değerlendirmede Groq yongalarının 800 tokens per second düzeyine kadar çıkabildiği, NVIDIA çözümlerinin ise 450 tokens per second civarında kaldığı belirtiliyor. Bu da AI hızlandırıcı pazarında tek bir metriğin yeterli olmadığını; satın alma maliyeti, enerji verimliliği, çıktı hızı ve token başına maliyet gibi farklı başlıkların birlikte değerlendirildiğini gösteriyor.

