Elon Musk, En Son Grok 2 AI Modelini Yayınlıyor. Hedefte OpenAI Var

14 Ağustos 2024

114

Elon Musk’ın yapay zeka şirketi xAI, sonunda Grok 2 adlı son nesil yapay zeka modelini yayınladı. xAI ve kurucusunun Tesla ve X’teki sahiplik hisseleri, şirketin ürünlerine talep yaratmasına ve yapay zeka modellerini eğitmek için gereken pahalı bilgi işlem kaynaklarını kullanmasına olanak sağladı. Bugünkü duyuru, Musk’ın bu yılın başlarında modelde yakında bir güncelleme sözü veren yorumlarını takip ediyor.

Grok’un yanı sıra, Amazon destekli Anthropic’in Claude’u, Microsoft destekli OpenAI’nin ChatGPT’si, Facebook sahibi Meta’nın Llama’sı ve Google’ın Gemini’si dünyadaki önde gelen AI yazılım ürünleri arasındadır. Bunların hepsi genel tüketici ve kurumsal kullanım durumları için AI özellikleri sunar ve Grok 2’nin sürümü bu iki yönü de kapsıyor.

xAI’nin en son Grok sürümü, Grok 2’nin erken bir önizlemesini ve bir mini Grok 2 modelini içeriyor; her ikisi de Musk’ın X sosyal medya platformunda kullanıcılara sunulacak. Grok 2, UC Berkley’nin Büyük Model Sistemleri Örgütü’nün (LMSYS) AI kıyaslamasında test edildi ve OpenAI’nin GPT-4o’suyla neredeyse eşleştiği ortaya çıktı.

LMSYS’ye göre Grok 2, matematik ve kodlamada 2. en iyi, zor komutlara yanıt verme becerisinde ise 3. sırada yer aldı ve bu da genel liderlik tablosunda üçüncü sıraya yükselmesine yol açtı. Grok 2’nin önünde ChatGPT 4.0 ve Google’ın Gemini 1.5 Pro’su yer alıyor.

xAI’nin kendi verileri, Grok 2’nin GPT 4 Turbo’dan daha iyi performans gösterdiğini ve GPT 4o’dan küçük bir farkla geride kaldığını gösteriyor. Ancak, OpenAI’nin ChatGPT 4o, xAI’nin verilerinde bile, 1.314’lük genel LMSYS ELO derecesi sayesinde AI performansının kralı. Öte yandan, xAI’nin Grok 2’nin erken sürümü 1.281’lik bir dereceye sahipken, Gemini 1.5 Pro’nun ortanca puanı 1.297

Sohbet robotu performansına gelince, Grok 2, daha iyi derecelendirilen yanıtların yüzdesini ölçen ‘kazanma oranı’nda Gemini 1.5 Pro’nun gerisinde kalıyor. Google’ın ürününe karşı oranı %48 ve xAI’nin verileri, kullanıcıların resim yüklemesine ve AI’dan bunlara dayalı yanıtlar üretmesini istemesine olanak tanıyan bir model olan OpenAI’nin ChatGPT 4o için karşılaştırılabilir rakamlar göstermiyor.

Woah, another exciting update from Chatbot Arena❤️‍🔥

The results for @xAI’s sus-column-r (Grok 2 early version) are now public**!

With over 12,000 community votes, sus-column-r has secured the #3 spot on the overall leaderboard, even matching GPT-4o! It excels in Coding (#2),… https://t.co/gqSWSwYN0z pic.twitter.com/j9UYDBYNt4
— lmsys.org (@lmsysorg) August 14, 2024

Gerçek doğruluğun iyileştirilmesi, xAI’nin Grok 2’nin performansını iyileştirdiğini iddia ettiği bir diğer önemli alandır. Erken AI modelleri gerçek dışı oldukları için eleştirilmiştir ve firmanın dahili ‘AI Öğretmenleri’ Grok 2 ve Grok 2 mini kazanma oranlarını gerçekliğe göre %62,9 ve %59,6 olarak vermiştir – önceki yinelemenin %50 kazanma oranına göre büyük iyileştirmeler.

xAI, Grok 2’nin ” hem metin hem de görsel anlamada gelişmiş yeteneklerle ” geldiğini ve modelin X’te mevcut verileri kullandığını söylüyor. Diğer AI ürünleri gibi, Grok 2 mini’nin de yazma, kodlama veya metinsel istem yanıtları oluşturma gibi özellikleri destekleyen genel tüketici kullanımına yönelik olduğu görülüyor.

xAI, Grok 2 ve Grok 2 mini’nin bu ayın sonuna kadar ürünlerinin kurumsal kullanım durumları için geliştiricilere sunulacağını paylaşıyor. API, ” dünya çapında düşük gecikmeli erişim için çok bölgeli çıkarım dağıtımları ” ve zorunlu çok faktörlü kimlik doğrulama, faturalama için veri analitiği, trafik analizi ve şirket içi iş sistemleriyle entegrasyon sunuyor.

Önceki İçerik

GPD’nin yeni Pocket 4’ü Ryzen AI 9 HX 370 ile geliyor

Sonraki İçerik

Google Android 15 Beta 4.2’yi Yayımladı

Benzer İçerikler

Elon Musk, En Son Grok 2 AI Modelini Yayınlıyor. Hedefte OpenAI Var

Ev internetinde yeni dönem: Operatör değişimi e-Devlet’e taşınıyor

AMD, 208MB önbellek ve 200W TDP’li Ryzen 9 9950X3D2’yi tanıttı

PS5 Pro’nun gizli gücü PSSR, FSR 4’ün izinden gidiyor

Yorum Yap İptal

Haberler

GTA 6, oyun tarihinin en pahalı yapımı olabilir

ASUS, yapay zekâ destekli ExpertCenter P600 AiO’yu tanıttı

Ev internetinde yeni dönem: Operatör değişimi e-Devlet’e taşınıyor

TEAMGROUP, T-CREATE CLASSIC H514 Gen5 SSD’yi tanıttı

CD Projekt: “Oyunlarımızı insanlar yapmaya devam edecek”

Son Yorumlar