Elon Musk’ın yapay zeka şirketi xAI, sonunda Grok 2 adlı son nesil yapay zeka modelini yayınladı. xAI ve kurucusunun Tesla ve X’teki sahiplik hisseleri, şirketin ürünlerine talep yaratmasına ve yapay zeka modellerini eğitmek için gereken pahalı bilgi işlem kaynaklarını kullanmasına olanak sağladı. Bugünkü duyuru, Musk’ın bu yılın başlarında modelde yakında bir güncelleme sözü veren yorumlarını takip ediyor.
Grok’un yanı sıra, Amazon destekli Anthropic’in Claude’u, Microsoft destekli OpenAI’nin ChatGPT’si, Facebook sahibi Meta’nın Llama’sı ve Google’ın Gemini’si dünyadaki önde gelen AI yazılım ürünleri arasındadır. Bunların hepsi genel tüketici ve kurumsal kullanım durumları için AI özellikleri sunar ve Grok 2’nin sürümü bu iki yönü de kapsıyor.
xAI’nin en son Grok sürümü, Grok 2’nin erken bir önizlemesini ve bir mini Grok 2 modelini içeriyor; her ikisi de Musk’ın X sosyal medya platformunda kullanıcılara sunulacak. Grok 2, UC Berkley’nin Büyük Model Sistemleri Örgütü’nün (LMSYS) AI kıyaslamasında test edildi ve OpenAI’nin GPT-4o’suyla neredeyse eşleştiği ortaya çıktı.
LMSYS’ye göre Grok 2, matematik ve kodlamada 2. en iyi, zor komutlara yanıt verme becerisinde ise 3. sırada yer aldı ve bu da genel liderlik tablosunda üçüncü sıraya yükselmesine yol açtı. Grok 2’nin önünde ChatGPT 4.0 ve Google’ın Gemini 1.5 Pro’su yer alıyor.
xAI’nin kendi verileri, Grok 2’nin GPT 4 Turbo’dan daha iyi performans gösterdiğini ve GPT 4o’dan küçük bir farkla geride kaldığını gösteriyor. Ancak, OpenAI’nin ChatGPT 4o, xAI’nin verilerinde bile, 1.314’lük genel LMSYS ELO derecesi sayesinde AI performansının kralı. Öte yandan, xAI’nin Grok 2’nin erken sürümü 1.281’lik bir dereceye sahipken, Gemini 1.5 Pro’nun ortanca puanı 1.297
Sohbet robotu performansına gelince, Grok 2, daha iyi derecelendirilen yanıtların yüzdesini ölçen ‘kazanma oranı’nda Gemini 1.5 Pro’nun gerisinde kalıyor. Google’ın ürününe karşı oranı %48 ve xAI’nin verileri, kullanıcıların resim yüklemesine ve AI’dan bunlara dayalı yanıtlar üretmesini istemesine olanak tanıyan bir model olan OpenAI’nin ChatGPT 4o için karşılaştırılabilir rakamlar göstermiyor.
Gerçek doğruluğun iyileştirilmesi, xAI’nin Grok 2’nin performansını iyileştirdiğini iddia ettiği bir diğer önemli alandır. Erken AI modelleri gerçek dışı oldukları için eleştirilmiştir ve firmanın dahili ‘AI Öğretmenleri’ Grok 2 ve Grok 2 mini kazanma oranlarını gerçekliğe göre %62,9 ve %59,6 olarak vermiştir – önceki yinelemenin %50 kazanma oranına göre büyük iyileştirmeler.
xAI, Grok 2’nin ” hem metin hem de görsel anlamada gelişmiş yeteneklerle ” geldiğini ve modelin X’te mevcut verileri kullandığını söylüyor. Diğer AI ürünleri gibi, Grok 2 mini’nin de yazma, kodlama veya metinsel istem yanıtları oluşturma gibi özellikleri destekleyen genel tüketici kullanımına yönelik olduğu görülüyor.
xAI, Grok 2 ve Grok 2 mini’nin bu ayın sonuna kadar ürünlerinin kurumsal kullanım durumları için geliştiricilere sunulacağını paylaşıyor. API, ” dünya çapında düşük gecikmeli erişim için çok bölgeli çıkarım dağıtımları ” ve zorunlu çok faktörlü kimlik doğrulama, faturalama için veri analitiği, trafik analizi ve şirket içi iş sistemleriyle entegrasyon sunuyor.