Zyphra, AMD ile yaptığı iş birliği kapsamında yeni açık kaynak odaklı yapay zeka platformu Zyphra Cloud’u duyurdu. Wccftech’in aktardığı bilgilere göre servis, özellikle çıkarım odaklı bir altyapı olarak konumlanıyor ve DeepSeek V3.2, Kimi K2.6 ile GLM 5.1 gibi açık ağırlıklı ileri seviye modelleri hedefliyor. Şirketin verdiği çerçeveye göre amaç, yüksek işlem hacmi ve düşük gecikmeyi aynı anda sunarak ajan tabanlı iş akışları, derin araştırma senaryoları ve uzun bağlam gerektiren kullanımlarda daha verimli bir deneyim sağlamak.
Platformun teknik temelinde AMD donanımı yer alıyor. Zyphra Cloud, TensorWave altyapısı üzerinde çalışıyor ve bu tarafta binlerce AMD Instinct hızlandırıcı kullanılıyor. Duyurunun en dikkat çekici noktası ise TensorWave’in MI355X kurulumundan gelen 15MW düzeyindeki hesaplama kapasitesi. Zyphra, bu mevcut kurulumla yetinmeyeceğini, ileride MI450 ve daha yeni nesil GPU’lara doğru genişleme imkanı bulunduğunu da belirtiyor. Haberde daha ileri modellere dair bir ima bulunsa da somut ürün adı olarak verilen gelecek seçenekler MI450 ve sonrası ile sınırlı.
Zyphra Cloud yalnızca klasik çıkarım yükleri için tasarlanan dar kapsamlı bir servis olarak sunulmuyor. Şirket, platformu zaman içinde daha geniş ve entegre bir AI ortamına dönüştürmeyi planlıyor. Yol haritasında reinforcement learning ve fine-tuning gibi yetenekler de yer alıyor. Bu yeni kabiliyetlerin AMD’nin güncel EPYC işlemcileriyle ve ayrılmış GPU kümelerine erişimle destekleneceği ifade ediliyor. Böylece servis, sadece model çalıştırma tarafında değil, model geliştirme ve özelleştirme aşamalarında da daha kapsamlı bir çözüm olmayı hedefliyor.

Performans tarafında Zyphra’nın vurgusu, özel kernel optimizasyonları, uzun bağlam için geliştirilen yeni çıkarım algoritmaları ve gelişmiş paralellik teknikleri üzerine kurulu. Şirket bu yaklaşımın yüksek throughput ile düşük latency dengesini iyileştirdiğini söylüyor. Bu tür optimizasyonlar özellikle çok adımlı muhakeme, uzun süreli bağlam takibi ve birden fazla aracı içeren iş akışlarında önem kazanıyor. Duyuruda doğrudan karşılaştırmalı benchmark paylaşılmasa da, platformun konumlandırması açık biçimde modern açık ağırlıklı modeller için üretim seviyesinde çıkarım hizmeti sunmaya odaklanıyor.
TensorWave cephesinde de dikkat çekici bir arka plan bulunuyor. Şirket, 2024 yılında 2025’e kadar dünyanın en büyük AMD GPU kümelerinden birini kurma planını açıklamıştı. Bu plan kapsamında MI300X, MI325X ve MI350X GPU’ların yer aldığı büyük ölçekli kurulumlardan söz ediliyordu. O dönemde hedeflenen yapı için çoklu gigawatt seviyesinde hesaplama kapasitesi ifadesi kullanılmıştı. Zyphra gibi AI şirketlerinin bugün bu kurulu kapasiteyi gerçek ürün ve müşteri iş yükleri için kullanmaya başlaması, AMD tabanlı bulut altyapılarının artık daha görünür hale geldiğini gösteriyor.

TensorWave Kurucu Ortağı ve Chief Growth Officer görevindeki Jeff Tatarchuk da ortaklığı değerlendiren bir açıklama yaptı. Tatarchuk, AI-native şirketlerin taviz vermeden özel ve yüksek performanslı AMD hesaplama kaynaklarına ihtiyaç duyduğunu, Zyphra Inference’ın MI355X altyapıları üzerinde çalıştırılmasının da TensorWave’in kuruluş amacına uygun bir ortaklık olduğunu söyledi. Açıklamanın odağında, güncel AMD hızlandırıcılarıyla ölçekli biçimde üretime hazır AI hizmetleri sunulabilmesi yer alıyor.
Zyphra, bulut servisinin yanında kendi model ailesini de büyütüyor. Şirketin duyurduğu modeller arasında ZAYA1-8B adlı reasoning modeli, 74B parametreye kadar çıkan bir MoE model olarak tanımlanan ZAYA1-74B ve ilk vision-language modeli olan ZAYA1-VL yer alıyor. Bu modeller, Zyphra’nın yalnızca altyapı sağlayıcısı olmayı değil, aynı zamanda model katmanında da aktif kalmayı istediğine işaret ediyor. Özellikle reasoning ve vision-language tarafındaki ürünler, şirketin kullanım alanını yalnızca metin üretimiyle sınırlamadığını gösteriyor.

Sonuç olarak Zyphra Cloud, ABD merkezli ve tamamen AMD tabanlı bir AI bulut girişimi olarak dikkat çekiyor. Açık ağırlıklı modelleri hedeflemesi, MI355X üzerinden 15MW hesaplama kapasitesi sunması ve ileride EPYC destekli fine-tuning ile reinforcement learning işlevleri eklemeyi planlaması platformun temel öne çıkan noktaları arasında. Servis bugün itibarıyla erişime açılmış durumda; daha fazla bilgi ve erişim detayları için Zyphra’nın resmi sayfası kullanılabiliyor.

