Alibaba, agentic AI iş yüklerini hedefleyen yeni yapay zekâ donanımı ve modelini duyurdu. Şirketin kendi geliştirdiği PPU (Parallel Processing Unit) mimarisini kullanan Zhenwu M890, özellikle çıkarım tarafına odaklanıyor. Çipte Transformer core engine yer alıyor ve FP16 hesaplamada 0.6 PFLOPs seviyesine ulaşıyor. Verilen bilgilere göre bu seviye NVIDIA A100 ile karşılaştırılabilir durumda ve Hopper H20 çözümünden 3 kat daha yüksek performans sunuyor. Alibaba ayrıca M890’ın önceki nesle göre toplam hesaplama performansını 3 kat artırdığını belirtiyor.
Teknik tarafta Zhenwu M890, 144 GB HBM3 bellekle geliyor. Bu da 96 GB belleğe sahip Zhenwu 810E’ye kıyasla %50 artış anlamına geliyor. Çipin ara bağlantı bant genişliği ise 700 GB/s’den 800 GB/s’ye yükseltilmiş. M890; FP32, FP16, FP8 ve FP4 formatlarını destekliyor. Alibaba, yeni hızlandırıcıyla birlikte daha geniş bir platform da hazırlamış durumda. ICN Switch 1.0 adlı ara bağlantı yongası 25.6 Tb/s hız sunarken, P2P gecikmesi 150ns’nin altında tutuluyor. Bu yapı, yüksek eşzamanlı ajan iş yükleri için tasarlanmış.

Sunucu tarafında Yitian tabanlı Arm host CPU, Panmai ağ kartları ve yeni hızlandırıcılar Panjiu AL128 Supernode Server içinde bir araya geliyor. Bu sistem tek bir rack içinde 128 AI hızlandırıcıyı sıkı biçimde entegre ediyor ve PB/s ölçeğinde bant genişliği hedefliyor. Şirket bugüne kadar yaklaşık 560.000 Zhenwu AI çipi sevk ettiğini ve 20 sektörde 400’ün üzerinde harici müşteriye ulaştığını da paylaştı.

Alibaba aynı etkinlikte Qwen3.7-Max modelini de tanıttı. Yeni model; agentic coding, karmaşık akıl yürütme ve uzun süreli görev yürütmeye odaklanıyor. Açıklanan bilgilere göre model 35 saate kadar kesintisiz çalışabiliyor ve 1.000’in üzerinde araç çağrısını performans düşüşü olmadan yönetebiliyor. Geliştiriciler ve kurumsal kullanıcılar için yakında erişime açılması planlanıyor.


