8.7 C
İstanbul
31 Mart 2025 Pazartesi
Ana SayfaYapay ZekaGemini 2.5: Google bugüne kadarki 'en akıllı' yapay zeka modeli olabilir

Gemini 2.5: Google bugüne kadarki ‘en akıllı’ yapay zeka modeli olabilir

Gemini 2.5, Google DeepMind tarafından bugüne kadarki “en akıllı yapay zeka modeli” olabilir. DeepMind’ın çok çeşitli kıyaslamalarda en son teknoloji sonuçları elde ettiğini söylediği bu son nesildeki ilk model, Gemini 2.5 Pro’nun deneysel versiyonu.

Google DeepMind CTO’su Koray Kavukcuoglu’na göre Gemini 2.5 modelleri “düşünen modeller”dir. Bu, bir yanıt üretmeden önce düşüncelerini akıl yürütme yeteneklerini ifade eder ve bu da gelişmiş performans ve iyileştirilmiş doğrulukla sonuçlanır.    

Kavukçuoğlu, “akıl yürütme” kapasitesinin salt sınıflandırma ve tahminin ötesine uzandığını açıklıyor. Sistemin bilgiyi analiz etme, mantıksal sonuçlar çıkarma, bağlamı ve nüansı birleştirme ve nihayetinde bilinçli kararlar alma yeteneğini kapsıyor.

DeepMind, bir süredir takviyeli öğrenme ve düşünce zinciri istemi gibi teknikleri kullanarak yapay zekanın zekasını ve muhakeme yeteneklerini geliştirme yöntemlerini araştırıyor. Bu temel çalışma, yakın zamanda ilk düşünme modeli olan Gemini 2.0 Flash Thinking’in tanıtılmasına yol açtı.    

Kavukçuoğlu, “Şimdi Gemini 2.5 ile, önemli ölçüde geliştirilmiş bir temel modeli, iyileştirilmiş eğitim sonrası özelliklerle birleştirerek yeni bir performans seviyesine ulaştık” diyor.

Google, bu düşünme yeteneklerini doğrudan gelecekteki tüm modellerine entegre etmeyi planlıyor. Bu sayede daha karmaşık sorunları ele alabilecek ve daha yetenekli, bağlam farkında aracıları destekleyebilecekler.   

Gemini 2.5 Pro Experimental, DeepMind’ın karmaşık görevleri ele almak için en gelişmiş modeli olarak konumlandırılmıştır. Yazım tarihi itibarıyla, insan tercihlerini değerlendirmek için önemli bir ölçüt olan LMArena liderlik tablosunda önemli bir farkla en üst sırayı elde etmiş ve yüksek kaliteli bir stile sahip oldukça yetenekli bir model olduğunu göstermiştir.

Özellikle, çoğunluk oylaması gibi maliyetleri artıran test zamanı tekniklerine güvenmeden, GPQA ve AIME 2025 gibi matematik ve fen ölçütlerinde öndedir. Ayrıca, konu uzmanları tarafından bilgi ve muhakemenin insan sınırını değerlendirmek için tasarlanmış bir veri kümesi olan Humanity’s Last Exam’da %18,8’lik son teknoloji bir puan elde etti.

DeepMind, kodlama performansına önemli bir vurgu yaptı ve Gemini 2.5, öncülü 2.0’a kıyasla önemli bir sıçramayı temsil ediyor ve geliştirme aşamasında daha fazla iyileştirme bulunuyor. 2.5 Pro, görsel olarak ilgi çekici web uygulamaları ve aracı kod uygulamaları oluşturmanın yanı sıra kod dönüştürme ve düzenleme konusunda da üstün performans gösteriyor.

Agentic kod değerlendirmeleri için endüstri standardı olan SWE-Bench Verified’da Gemini 2.5 Pro, özel bir agent kurulumu kullanarak %63,8’lik bir puan elde etti. Modelin akıl yürütme yetenekleri, tek satırlık bir komuttan yürütülebilir kod üreterek bir video oyunu oluşturmasını da sağlar.

HWM
HWMhttps://hardwaremania.com
Yoda is a revered former Jedi Master who spent the last years of his life on Dagobah. The nine-hundred-year-old Jedi master trained Jedi knights for eight centuries.
Benzer İçerikler

Haberler

Son Yorumlar

- Advertisment -