Anthropic, yeni nesil Claude Sonnet 5 modelini kullanıma sunarken daha önce geçici olarak kapatılan Fable ve Mythos frontier modellerine erişimi de yeniden açtı. Bu adım, 12 Haziran’da başlayan ve ABD ihracat kontrol incelemesi nedeniyle 18 gün süren operasyonel duraklamanın sona erdiğini gösteriyor. Süreç boyunca şirketin en yüksek yetenek seviyesindeki sistemleri geçici olarak devre dışı bırakılmıştı.
Geçici kısıtlamanın nedeni, Amazon araştırmacılarının Fable 5’in güvenlik kontrollerini aşmaya yönelik bir yöntem belgelemesi oldu. Söz konusu açık, modelin yazılım zafiyetlerini tanımlamasına ve buna bağlı sömürü kodu üretmesine yol açabiliyordu. Anthropic, bu mekanizmayı hedefleyen güncellenmiş bir otomatik sınıflandırıcı geliştirdiğini ve bunun ardından modeli kendi platformunda, bulut altyapısında ve iş ortağı ağlarında yeniden tam ölçekli olarak devreye alabildiğini açıkladı.
Fable 5 ve Mythos 5’in askıya alınması, frontier yapay zeka sistemlerinin giderek artan düzenleyici baskılar altında çalıştığını da ortaya koydu. İhracat kontrol talimatı yürürlüğe girdiğinde, gerçek zamanlı kullanıcı vatandaşlığı doğrulama sistemlerinin bulunmaması nedeniyle küresel çapta tüm kullanıcılar için tam erişim kesintisi uygulanmak zorunda kaldı. Bu durum, teknik bir güvenlik sorununun kısa sürede operasyonel ve hukuki bir probleme dönüşebildiğini gösterdi.
Kapatma sürecinde yapılan güvenlik değerlendirmeleri, zafiyet tanımlama davranışının yalnızca Fable 5’e özgü olmadığını da ortaya koydu. Birden fazla sağlayıcının daha eski ve daha düşük yetenekli mimarileri de aynı sonuçları tekrar edebildi. Buna Claude Opus 4.8, GPT-5.5 ve Kimi K2.7 de dahil edildi. Yani sorun tek bir model ailesinden çok, belirli türde yönlendirmelere verilen genel model tepkileriyle ilgili daha geniş bir güvenlik çerçevesine işaret ediyor.
Federal direktifi karşılamak için geliştirilen yeni güvenlik katmanı, Amazon’un rapor ettiği spesifik atlatma yöntemini hedefliyor. Bu yazılım katmanı geniş bir güvenlik marjıyla çalışıyor ve kötü niyet ihtimali taşıyan muğlak geliştirici istemlerini tespit edip engelliyor. Şirketin iç doğrulama verilerine göre güncellenen sınıflandırıcı, bildirilen sömürü tekniğini denemelerin yüzde 99’undan fazlasında durdurabiliyor.

Bununla birlikte bu yaklaşımın belirgin bir bedeli var. Eğer bir geliştiricinin istemi sistemin güvenlik sınırını tetiklerse, iş yükü sürekliliği korumak için otomatik olarak daha eski Opus 4.8 mimarisine yönlendiriliyor. Daha geniş güvenlik marjı, günlük uygulama geliştirme ve hata ayıklama süreçlerinde zararsız istemlerin de daha sık işaretlenmesine neden oluyor. Başka bir deyişle, güvenlik seviyesi yükselirken yanlış pozitif olasılığı da artıyor.
Ticari tarafta ise kısa vadeli odak noktası yeni devreye alınan Claude Sonnet 5. Şirketin paylaştığı tabloya göre model, SWE-bench Pro testinde yüzde 63.2, Terminal-Bench 2.1 testinde ise yüzde 80.4 skor elde ediyor. Karşılaştırma için Sonnet 4.6 aynı testlerde yüzde 58.1 ve yüzde 67.0, Opus 4.8 ise yüzde 69.2 ve yüzde 82.7 seviyesinde bulunuyor. Böylece Sonnet 5, Opus 4.8’in gerisinde kalsa da önceki Sonnet sürümüne göre kayda değer bir artış sunuyor.
Maliyet tarafında Sonnet 5’in taban fiyatı milyon token başına $3.00 giriş ve $15.00 çıkış olarak veriliyor. Sonnet 4.6 aynı fiyatlandırmaya sahipken Opus 4.8 milyon token başına $5.00 giriş ve $25.00 çıkış seviyesinde. Ayrıca Sonnet 5 için 31 Ağustos 2026’ya kadar geçerli tanıtım fiyatı da bulunuyor: $2.00 giriş ve $10.00 çıkış. Bu da modeli, yüksek yürütme kapasitesini korurken operasyon maliyetini düşürmek isteyen ekipler için daha cazip hale getiriyor.
Anthropic, Sonnet 5’in çok adımlı planları uygulayabildiğini, terminal ortamlarında çalışabildiğini ve web tarayıcılarında insan müdahalesi olmadan gezinebildiğini söylüyor. Bu yetenek seti özellikle otonom yazılım ajanı senaryolarında önem taşıyor. Şirketin vurgusu, yalnızca tek adımlı metin üretimi değil; test çalıştırma, sonuç doğrulama, ortamlar arasında geçiş ve görevi uçtan uca tamamlama gibi birleşik iş akışlarının daha tutarlı biçimde yerine getirilmesi yönünde.
Gerçek kullanım örnekleri de bu çerçeveyi destekliyor. Rakuten tarafında teknoloji ekipleri, modeli şirketin en zorlu üretim kodu pull request örneklerinden düzinelercesi üzerinde kullandı. Sistem her gönderimi bağımsız olarak işledi, testleri çalıştırdı, sonuçları doğruladı ve tamamlanan kodu son yapısal onay için insan mühendislere sundu. Buradaki önemli nokta, modelin yalnızca öneri üretmekle kalmaması; doğrulama adımını da iş akışının doğal bir parçası haline getirmesi.
Zapier ise modeli çekirdek ürün akışlarına entegre ederek çok parçalı idari görevlerde kullandı. Belgelenen örneklerden birinde sistemden Salesforce hesap katmanlarını güncellemesi ve ardından kurumsal kişilere lansman duyuruları üretip göndermesi istendi. Önceki model mimarilerinin bu tür çok aşamalı işlemlerde yarıda kaldığı, mevcut sistemin ise süreci baştan sona insan müdahalesi olmadan tamamlayabildiği aktarılıyor.
Zed tarafında kullanım senaryosu hata ayıklama otomasyonu oldu. İç testlerde mühendisler modele aktif bir yazılım hatasını inceleme görevi verdi. Sistem, açık adım adım komutlar olmadan hatayı yeniden üreten bir test betiği oluşturdu, gerekli kod düzeltmesini uyguladı ve yamayı kaldırdığında hatanın yeniden ortaya çıktığını doğrulamak için değişiklikleri sakladı. Tüm teşhis ve düzeltme zinciri tek bir işlem geçişi içinde tamamlandı.
Factory de modeli karmaşık kod tabanlarında uzun süreli görevleri yönetmek için devreye aldı. Teknik ekipler, sistemin kurumsal kod depoları boyunca mantıksal bağlamını ve yürütme tutarlılığını koruduğunu; önceki nesil yazılım katmanlarının zaman aşımına uğradığı ya da çözemediği görevleri tamamlayabildiğini bildirdi. Bu, özellikle büyük ve dağınık kod tabanlarında ajan tabanlı araçların pratik değerini artıran bir gösterge olarak öne çıkıyor.
Güvenlik tarafında yayımlanan sistem kartına göre Sonnet 5, otonom yeteneklerini artırırken risk profilini aynı ölçüde büyütmüyor. Aldatıcı davranış eğilimleri ve izinsiz taleplerle iş birliği yapma olasılığını test eden otomatik denetimlerde model, doğrudan selefi Sonnet 4.6’ya kıyasla daha düşük genel uygunsuz davranış oranı gösterdi. Bu da performans artışının güvenlikten doğrudan taviz verilerek sağlanmadığına işaret ediyor.
Şirket ayrıca modelin gelişmiş saldırgan siber güvenlik yeteneklerine sahip olmadığını belirtiyor. Eğitim protokolünde özel saldırgan siber güvenlik veri setlerine yer verilmediği, böylece modelin daha çok rutin ve savunma odaklı teknik görevlerle sınırlı tutulduğu ifade ediliyor. Mozilla ile ortak yürütülen kamuya açık güvenlik testlerinde araştırmacılar, modelin Firefox 147 tarayıcı çekirdeğindeki bilinen açıklar için işlevsel exploit üretme kapasitesini ölçtü.
Sonuçlar burada da sınırlı kaldı. Model, değerlendirme pencerelerinin tamamında tek bir çalışan exploit dahi üretemedi ve yüzde 0 başarı oranı kaydetti. Buna karşılık yüzde 13.2 oranında kısmi başarı elde edildi. Bu oran Sonnet 4.6’ya göre küçük bir artış anlamına geliyor, ancak şirket bu farkı alana özgü saldırgan eğitimden çok genel mantıksal akıl yürütme iyileşmesine bağlıyor. Ticari sürümlerde de önlem amacıyla Opus 4.8 çerçevesinde kullanılanlarla eşdeğer gerçek zamanlı güvenlik sınıflandırıcıları varsayılan olarak etkin geliyor.
Fable 5 etrafındaki düzenleyici gerilim, Anthropic, Amazon, Microsoft ve Google arasında model güvenlik ihlallerini değerlendirmek için ortak bir endüstri çerçevesi kurulmasına da yol açtı. Bugün sağlayıcıların sistem atlatmalarının ciddiyetini sınıflandırmak için paylaşılan bir metriği bulunmuyor. Bu eksiklik, yeni istem zafiyetleri tespit edildiğinde düzenleyici belirsizlik yaratıyor. Önerilen yönetişim modeli dört teknik ölçüte dayanıyor: yetenek kazanımı, bu kazanımın kapsamı, silahlandırma kolaylığı ve keşfedilebilirlik. Amaç, geliştiriciler ile siber güvenlik ekiplerinin savunma tepkilerini daha nesnel bir zeminde koordine edebilmesi. Yüksek ciddiyetli durumlarda otomatik azaltım mekanizmaları anında devreye alınacak. Bu süreç, yeni HackerOne araştırma programı, 24 saat çalışan kurumsal izleme ekibi ve kamuya açılmadan önce federal araştırmacılarla yapılan erken değerlendirme anlaşmalarıyla birlikte ilerleyecek.

