Gemini 2.5: Google bugüne kadarki ‘en akıllı’ yapay zeka modeli olabilir

27 Mart 2025

101

Gemini 2.5, Google DeepMind tarafından bugüne kadarki “en akıllı yapay zeka modeli” olabilir. DeepMind’ın çok çeşitli kıyaslamalarda en son teknoloji sonuçları elde ettiğini söylediği bu son nesildeki ilk model, Gemini 2.5 Pro’nun deneysel versiyonu.

Google DeepMind CTO’su Koray Kavukcuoglu’na göre Gemini 2.5 modelleri “düşünen modeller”dir. Bu, bir yanıt üretmeden önce düşüncelerini akıl yürütme yeteneklerini ifade eder ve bu da gelişmiş performans ve iyileştirilmiş doğrulukla sonuçlanır.

Kavukçuoğlu, “akıl yürütme” kapasitesinin salt sınıflandırma ve tahminin ötesine uzandığını açıklıyor. Sistemin bilgiyi analiz etme, mantıksal sonuçlar çıkarma, bağlamı ve nüansı birleştirme ve nihayetinde bilinçli kararlar alma yeteneğini kapsıyor.

DeepMind, bir süredir takviyeli öğrenme ve düşünce zinciri istemi gibi teknikleri kullanarak yapay zekanın zekasını ve muhakeme yeteneklerini geliştirme yöntemlerini araştırıyor. Bu temel çalışma, yakın zamanda ilk düşünme modeli olan Gemini 2.0 Flash Thinking’in tanıtılmasına yol açtı.

Kavukçuoğlu, “Şimdi Gemini 2.5 ile, önemli ölçüde geliştirilmiş bir temel modeli, iyileştirilmiş eğitim sonrası özelliklerle birleştirerek yeni bir performans seviyesine ulaştık” diyor.

Google, bu düşünme yeteneklerini doğrudan gelecekteki tüm modellerine entegre etmeyi planlıyor. Bu sayede daha karmaşık sorunları ele alabilecek ve daha yetenekli, bağlam farkında aracıları destekleyebilecekler.

Gemini 2.5 Pro Experimental, DeepMind’ın karmaşık görevleri ele almak için en gelişmiş modeli olarak konumlandırılmıştır. Yazım tarihi itibarıyla, insan tercihlerini değerlendirmek için önemli bir ölçüt olan LMArena liderlik tablosunda önemli bir farkla en üst sırayı elde etmiş ve yüksek kaliteli bir stile sahip oldukça yetenekli bir model olduğunu göstermiştir.

Özellikle, çoğunluk oylaması gibi maliyetleri artıran test zamanı tekniklerine güvenmeden, GPQA ve AIME 2025 gibi matematik ve fen ölçütlerinde öndedir. Ayrıca, konu uzmanları tarafından bilgi ve muhakemenin insan sınırını değerlendirmek için tasarlanmış bir veri kümesi olan Humanity’s Last Exam’da %18,8’lik son teknoloji bir puan elde etti.

DeepMind, kodlama performansına önemli bir vurgu yaptı ve Gemini 2.5, öncülü 2.0’a kıyasla önemli bir sıçramayı temsil ediyor ve geliştirme aşamasında daha fazla iyileştirme bulunuyor. 2.5 Pro, görsel olarak ilgi çekici web uygulamaları ve aracı kod uygulamaları oluşturmanın yanı sıra kod dönüştürme ve düzenleme konusunda da üstün performans gösteriyor.

Agentic kod değerlendirmeleri için endüstri standardı olan SWE-Bench Verified’da Gemini 2.5 Pro, özel bir agent kurulumu kullanarak %63,8’lik bir puan elde etti. Modelin akıl yürütme yetenekleri, tek satırlık bir komuttan yürütülebilir kod üreterek bir video oyunu oluşturmasını da sağlar.

Önceki İçerik

PowerColor Red Devil RX 9070 XT Limited Spectral White Edition, 8 Nisan’da geliyor

Sonraki İçerik

PlayStation Plus için Nisan ayının oyunları belli oldu

Benzer İçerikler

Gemini 2.5: Google bugüne kadarki ‘en akıllı’ yapay zeka modeli olabilir

Microsoft ve NVIDIA yapay zekâyı beslemek için nükleer santral kuracak

NVIDIA ve ComfyUI, RTX GPU’larda yerel 4K yapay zekâ video üretimini kolaylaştırıyor

Sam Altman: “İnsanların akıllanması 20 yıl sürüyor, yapay zekâ daha verimli”

Yorum Yap İptal

Haberler

GTA 6, oyun tarihinin en pahalı yapımı olabilir

ASUS, yapay zekâ destekli ExpertCenter P600 AiO’yu tanıttı

Ev internetinde yeni dönem: Operatör değişimi e-Devlet’e taşınıyor

TEAMGROUP, T-CREATE CLASSIC H514 Gen5 SSD’yi tanıttı

CD Projekt: “Oyunlarımızı insanlar yapmaya devam edecek”

Son Yorumlar