Google, özel TPU mimarisinin yedinci nesli olan yeni bir AI işlemcisini tanıttı. Ironwood olarak bilinen çipin, Google’ın en güçlü Gemini modellerinin ortaya çıkan ihtiyaçları için tasarlandığı bildirildi, örneğin Google’ın “düşünme” olarak adlandırmayı tercih ettiği simüle edilmiş akıl yürütme. Şirket, bu çipin daha güçlü aracı AI yeteneklerinin kilidini açacak büyük bir değişimi temsil ettiğini iddia ediyor. Google buna “çıkarım çağı” diyor.

Google, yeni bir Gemini sürümünün yeteneklerinden bahsettiğinde, modelin yeteneklerinin yalnızca koda değil, Google’ın altyapısına da bağlı olduğunu belirtiyor. Özel AI donanımı, çıkarımı hızlandırmanın ve bağlam pencerelerini genişletmenin temel bir unsurudur. Ironwood ile Google, şimdiye kadarki en ölçeklenebilir ve güçlü TPU’suna sahip olduğunu söylüyor; bu, AI’nın bir kullanıcı adına hareket ederek proaktif olarak veri toplamasına ve çıktılar üretmesine olanak tanıyacak. Google’ın aracı AI’dan bahsettiğinde kastettiği şey bu.
Ironwood, önceki Google Tensor İşlem Birimleri’ne (TPU’lar) kıyasla daha yüksek verim sağlıyor ve Google bu yongaları gerçekten paketlemeyi planlıyor. Ironwood, yeni geliştirilmiş bir Yongalar Arası Bağlantı (ICI) aracılığıyla birbirleriyle doğrudan iletişim kuracak olan 9.216’ya kadar sıvı soğutmalı yonga kümelerinde çalışmak üzere tasarlanmış.
Google, bu tasarımın yalnızca kendi Gemini modelleri için değil, aynı zamanda bulutta AI projeleri çalıştırmak isteyen geliştiriciler için de bir nimet olacağını söylüyor. Geliştiriciler, Ironwood’u iki farklı yapılandırmada kullanabilecek: 256 çipli sunucu veya tam boyutlu 9.216 çipli küme.

Google’ın Ironwood pod’ları daha büyük versiyonunda, 42,5 Exaflops’luk şaşırtıcı bir çıkarım hesaplaması üretebilir. Her çipin tepe verimi 4.614 TFLOP’tur ve Google bunun önceki çiplere göre önemli bir gelişme olduğunu iddia ediyor. Google ayrıca yeni TPU’lar için belleği artırdı ve her çip 192 GB’a sahip oldu; bu da Google’ın son nesil Trillium TPU’sundan altı kat daha fazla. Bellek bant genişliği de 4,5 katlık bir gelişmeyle 7,2 Tbps’ye çıktı.
Yapay zeka verimini ölçmenin sayısız yolu vardır ve bu da çipleri karşılaştırmayı zorlaştırır. Google, yeni TPU için kıyaslama ölçütü olarak FP8 hassasiyetini kullanıyor ancak bunu donanımda FP8’i desteklemeyen El Capitan süper bilgisayarı gibi bazı sistemlerle karşılaştırıyor. Bu nedenle, Ironwood “pod’larının” dünyanın en güçlü süper bilgisayarının karşılaştırılabilir segmentlerinden 24 kat daha hızlı olduğu iddiasını bir tutam tuzla almalısınız.
Google’ın TPU v6 donanımı da yukarıdaki karşılaştırma tablosunda belirgin bir şekilde yok. Şirket, Ironwood’un o çipe kıyasla watt başına iki kat daha güçlü olduğunu söylüyor. Bir sözcüye göre, Ironwood en iyi v5p’nin halefi olarak düşünülürken, TPU v6 (Trillium) daha az güçlü TPU v5e’nin devamı niteliğindeydi. Google, bu tabloda daha düşük özelliklere sahip çipleri göstermemeyi tercih etti, ancak kayıtlara geçmesi açısından, Trillium FP8 hassasiyetinde yaklaşık 918 TFLOPS’a ulaşabiliyordu.
Sağlanan kıyaslamalar biraz tuhaf olsa da, Ironwood Google’ın AI ekosistemi için açıkça büyük bir gelişme. Önceki TPU’lardan önemli bir farkla daha hızlı ve daha verimli ve Google’ın mevcut altyapısı LLM’lerde ve simüle edilmiş akıl yürütmede hızlı iyileştirmeler sağladı. Google’ın pazar lideri Gemini 2.5 modeli şu anda önceki nesil TPU’larda çalışıyor ve Google, Ironwood’un daha yüksek çıkarım hızı ve verimliliğinin önümüzdeki yıl daha fazla atılım için zemin hazırladığını söylüyor.