Anthropic, Yeni Yapay Zeka Performans Ölçüm Programını Başlattı

Anthropic, yapay zeka modellerinin performansını ve etkisini değerlendirebilecek yeni tür ölçütlerin geliştirilmesini finanse etmek için bir program başlattı. Program, özellikle generatif modeller gibi ileri düzey AI yeteneklerini ölçmeye odaklanacak.

By Serbestce

2 Temmuz 2024

0

165

Anthropic, duyurduğu programla, yapay zeka modellerinin ileri düzey yeteneklerini etkili bir şekilde ölçebilecek üçüncü taraf kuruluşlara ödeme yapmayı planlıyor. İlgilenenler, başvurularını sürekli olarak değerlendirilmek üzere sunabilirler.

Anthropic, resmi blogunda şunları yazdı: “Bu değerlendirmelere yaptığımız yatırım, tüm yapay zeka güvenliği alanını yükseltmeyi, tüm ekosisteme fayda sağlayacak değerli araçlar sunmayı amaçlıyor. Yüksek kaliteli, güvenlikle ilgili değerlendirmeler geliştirmek zorlayıcı olmaya devam ediyor ve talep arzı aşmış durumda.”

Yapay Zeka Değerlendirme Sorunu ve Çözüm Önerileri

Günümüzde en sık başvurulan yapay zeka ölçütleri, test edilen sistemlerin ortalama bir kullanıcı tarafından nasıl kullanıldığını yetersiz bir şekilde yansıtıyor. Özellikle modern generatif yapay zeka öncesinde yayınlanan bazı ölçütlerin, iddia ettikleri şeyleri ölçüp ölçmediği konusunda da sorular var.

Anthropic, yapay zeka güvenliği ve toplumsal etkiler üzerine odaklanan zorlayıcı ölçütler oluşturmayı öneriyor. Şirket, siber saldırıları gerçekleştirme, kitle imha silahlarını “geliştirme” ve insanları manipüle etme veya aldatma gibi görevleri değerlendiren testler çağrısında bulunuyor. Anthropic, ulusal güvenlik ve savunma ile ilgili yapay zeka riskleri için erken uyarı sistemi geliştirmeyi taahhüt ediyor.

Programın Amacı ve Desteklenecek Araştırma Alanları

Anthropic’in yeni programı, bilimsel çalışmalara yardımcı olma, çok dilli sohbetler yapma ve yerleşik önyargıları azaltma potansiyelini araştıran ölçütler ve “uçtan uca” görevler üzerinde araştırma yapılmasını desteklemeyi amaçlıyor. Ayrıca, toksisitenin kendiliğinden sansürlenmesi gibi konuları da içerecek.

Bu hedeflere ulaşmak için Anthropic, konu uzmanlarının kendi değerlendirmelerini geliştirmelerine ve modellerin büyük ölçekli denemelerine olanak tanıyan yeni platformlar öngörüyor. Şirket, program için tam zamanlı bir koordinatör işe aldığını ve potansiyel büyüklükte projeleri satın almayı veya genişletmeyi planladığını belirtti.

Anthropic, blog yazısında, “Projelerin ihtiyaçlarına ve aşamasına göre uyarlanmış bir dizi finansman seçeneği sunuyoruz,” dedi. “Ekipler, frontier red team, ince ayar, güven ve güvenlik gibi ilgili ekiplerden doğrudan Anthropic’in alan uzmanlarıyla etkileşime girme fırsatına sahip olacaklar.”

Şeffaflık ve Güven Sorunları

Anthropic’in yapay zeka değerlendirmelerini destekleme çabası, yeterli finansman ve iş gücü sağlandığı sürece takdire şayan bir girişim. Ancak, şirketin ticari yapay zeka yarışındaki hırsları göz önüne alındığında, tamamen güvenilir olup olmayacağı konusunda bazı endişeler var.

Anthropic, blog yazısında belirttiği üzere, finanse ettiği bazı değerlendirmelerin kendi geliştirdiği yapay zeka güvenlik sınıflandırmaları ile uyumlu olmasını istiyor. Bu durum, başvuru sahiplerini “güvenli” veya “riskli” yapay zeka tanımlamalarını kabul etmeye zorlayabilir.

Yapay zeka topluluğunun bir kısmı, Anthropic’in “felaket” ve “aldatıcı” yapay zeka risklerine yaptığı referanslara da itiraz edebilir. Birçok uzman, yapay zekanın dünya sonunu getirecek veya insanları zekâsıyla alt edecek yeteneklere sahip olacağına dair pek az kanıt olduğunu belirtmektedir.

Anthropic, programının “kapsamlı yapay zeka değerlendirmesinin bir endüstri standardı olmasına yönelik ilerlemeyi hızlandırmak” için bir katalizör olmasını umduğunu yazıyor. Bu, daha iyi yapay zeka ölçütleri oluşturma çabalarına açık, kurumsal olmayan girişimlerin de benimseyebileceği bir misyon. Ancak, bu çabaların bir yapay zeka satıcısı ile işbirliği yapıp yapmayacağı henüz belirsizliğini koruyor.

Önceki İçerik

Milk-V’den RISC-V Tabanlı Jupiter Anakart: Mini-ITX Form Faktörüyle Yenilikçi Çözüm

Sonraki İçerik

MSI, İki Yeni Oyun Monitörünü Tanıttı

Benzer İçerikler

Anthropic, Yeni Yapay Zeka Performans Ölçüm Programını Başlattı

Açık kaynak OSI2 ONE MRI, AI ile tanı için geliştiriliyor

OpenAI ajanının Hugging Face ihlali bir hafta fark edilmedi

Meta, Microsoft ve Nvidia açık AI modelleri için çağrı yaptı

Yorum Yap İptal

Haberler

YouTube Music’te en iyi ses kalitesi için ayarlar nasıl değişir

Açık kaynak OSI2 ONE MRI, AI ile tanı için geliştiriliyor

Nanoleaf Smart LED Monitor Stand, ışık ve ergonomiyi birleştiriyor

Apple TV, yeni flört belgeseliyle içerik yelpazesini genişletiyor

Character Limit Steam’de çıktı, sırada iOS sürümü var

Son Yorumlar