ABD yönetiminin Anthropic’in Fable 5 ve Mythos 5 modellerine yönelik hamlesi, yapay zeka ile siber güvenlik kesişiminde yeni bir tartışma başlattı. Şirkete gönderilen yazıda ulusal güvenlik gerekçesiyle ihracat kontrolü uygulandığı, bu iki modelin ABD içindeki ya da dışındaki hiçbir yabancı ülke vatandaşı tarafından kullanılamayacağı belirtildi. Kapsamın Anthropic çalışanlarını da içermesi nedeniyle şirket, uyum sağlamak için iki modeli tüm müşterilere kapatma yoluna gitti. Sonuç olarak erişim fiilen herkes için kesilmiş oldu.
Aktarılan bilgilere göre Anthropic’e karar için oldukça kısa bir süre tanındı. Şirketin mektubu aldıktan sonra yaklaşık 90 dakika içinde harekete geçmesi gerektiği ve bu süre içinde kararın gerekçesine dair ayrıntılı açıklama alamadığı belirtiliyor. Kullanılan dayanak, normalde çift kullanımlı teknolojilerde görülen ihracat kısıtlamalarına benziyor. Ancak kapsamın bu kadar geniş tutulması, yani yalnızca yabancı müşterileri değil şirket içi personeli de etkilemesi, kararı alışılmadık hale getiriyor.
Tartışmanın merkezinde, yasağın teknik gerekçesinin ne kadar sağlam olduğu sorusu var. Siber güvenlik dünyasında saygın bir isim olarak görülen Katie Moussouris, kararın dayanağı olarak öne çıkan üçüncü taraf inceleme raporunu değerlendirdi ve ortaya konan tablonun abartıldığı görüşünü paylaştı. Moussouris; Microsoft’un bug bounty programının oluşumunda, ABD Savunma Bakanlığı’nın Hack the Pentagon girişiminde ve çeşitli federal kurularda görev almış bir isim. Bu nedenle rapora yönelik eleştirileri sektörde ayrıca ağırlık taşıyor.
Anlatılanlara göre Anthropic, Fable 5 ve Mythos 5 modellerini yayımlamadan önce Amazon’dan bir inceleme yapmasını istedi. Daha sonra bu rapor Moussouris’e de iletildi. Raporda araştırmacıların Fable 5, Mythos 5 ve Claude Opus modellerine bilinen CVE’ler içeren açık kaynak kodlar verdiği, ayrıca yeni ama bilerek zafiyet eklenmiş kod örnekleri hazırladığı belirtiliyor. Modellerden bu kodları “güvenlik sorunları açısından incelemesi” istendiğinde Fable 5’in bunu reddettiği, ardından doğrudan “bu kodu düzelt” komutuyla ilerlenince modelin yamalama ve test üretimi gibi görevleri yerine getirdiği aktarılıyor.
İtirazın temel noktası da burada ortaya çıkıyor. Çünkü bu davranış, saldırı amaçlı bir sıçramadan çok savunma ekiplerinin ihtiyaç duyduğu türden bir yardımcı işlev olarak yorumlanıyor. Kodda zafiyet bulmak, düzeltme önermek, yamayı test etmek ve güvenlik ekiplerinin iş akışını hızlandırmak, kurumsal savunma tarafı için değerli yetenekler arasında görülüyor. Moussouris ve benzer düşünen uzmanlar, bunun bir “jailbreak” ya da korumaların dramatik biçimde aşılması olarak sunulmasına karşı çıkıyor.
Eleştiriler yalnızca bireysel düzeyde kalmış değil. Aralarında Alex Stamos gibi tanınmış isimlerin de bulunduğu 100’den fazla güvenlik uzmanının imza attığı mektupta, bu tür modellerin savunmacılara avantaj sağlayabileceği ve kısıtlamanın esasen saldırganlardan çok savunma tarafını zayıflatacağı savunuluyor. Argüman basit: kötü niyetli aktörlerin kullanabileceği teknikler ve araçlar küresel ölçekte zaten yayılıyor; buna karşılık düzenlenmiş, korumalar eklenmiş ve kurumsal bağlamda kullanılan modelleri devre dışı bırakmak, güvenlik ekiplerinin elini zayıflatabilir.
Bir başka önemli nokta da bu yeteneklerin Anthropic’e özgü olup olmadığı. Uzmanların önemli bölümü, açık ağırlıklı veya ABD dışı modellerin benzer kabiliyetlere çok uzak olmadığını düşünüyor. Belki daha fazla istem, daha fazla deneme ya da farklı yöntemler gerekebilir; ancak zafiyet bulma, istismar mantığını anlama ve düzeltme üretme gibi alanlarda benzer seviyelere ulaşılmasının çok uzun sürmeyeceği değerlendiriliyor. Bu da yalnızca tek bir şirketin modellerini hedef alan kısıtlamaların pratik etkisini tartışmalı hale getiriyor.

Tartışmada Wassenaar düzenlemesine de atıf yapılıyor. Moussouris’in de katkı sunduğu çerçevede, savunma amaçlı siber güvenlik faaliyetleri için bazı istisnalar tanınmıştı. Kötüye kullanım potansiyeli olan yazılımlar ile savunma ekiplerinin olay müdahalesi, zafiyet analizi ve koordineli güvenlik çalışmaları için ihtiyaç duyduğu teknikler arasında ayrım yapılması amaçlanıyordu. Bu açıdan bakıldığında, güvenlik açığı tespiti ve düzeltme süreçlerinde yararlı olan bir modelin doğrudan ihracat kısıtlamasına konu edilmesi, mevcut yaklaşımın ruhuna aykırı bulunuyor.
Kararın arka planında yalnızca teknik değerlendirmelerin değil, siyasi ve kurumsal gerilimlerin de rol oynamış olabileceği iddia ediliyor. Programda dile getirilen görüşe göre Anthropic ile Pentagon arasında yılın başlarında yaşanan fikir ayrılıkları, şirketin yönetimle ilişkilerini zaten zorlaştırmıştı. Buna ek olarak Amazon’un hazırladığı inceleme raporunun yönetime ulaşmış olması da dikkat çekiyor. Tüm bunlar bir araya geldiğinde, bazı çevrelerde Anthropic’in diğer şirketlere kıyasla daha sert biçimde hedef alındığı algısı güçlenmiş durumda.
Öte yandan kamu tarafında şeffaflık eksikliği eleştiriliyor. Kararın dayanağı olan resmi yazının kamuya açık biçimde yayımlanmamış olması ve yönetim cephesinden ayrıntılı bir açıklama gelmemesi, yorumların artmasına yol açıyor. Şirketin Beyaz Saray ile görüşmeler yürüttüğü ifade edilse de şu aşamada somut bir sonuç paylaşılmış değil. Bu belirsizlik de, yasağın teknik bir risk analizinden mi yoksa daha geniş bir politika yaklaşımından mı kaynaklandığı sorusunu açık bırakıyor.
Modelin kendisine dair bir başka ayrım da önemli. Tartışmanın konusu, güvenlik denemeleri için şirketlerin kullandığı korumasız bir önizleme sürümü değil; kamuya açılması planlanan ve çeşitli güvenlik bariyerleri bulunan daha kısıtlı bir sürüm. Dolayısıyla “bu kodu düzelt” gibi bir isteme yanıt vermesinin tek başına olağanüstü bir güvenlik ihlali sayılıp sayılmayacağı sorgulanıyor. Uzmanlara göre burada asıl mesele, yasa koyucuların ve karar vericilerin bu modellerin ne yaptığı, ne yapması gerektiği ve saldırı-savar dengesinde nereye oturduğu konusunda henüz ortak bir anlayışa sahip olmaması.
Genel tablo, yapay zekanın siber güvenlikte çift kullanımlı bir araç olarak nasıl ele alınacağına dair daha büyük bir tartışmanın parçası. Modeller geliştikçe hem açık tespiti hem de açık kapatma süreçlerinde daha etkili hale geliyorlar. Bu da düzenleyiciler için gerçek bir ikilem yaratıyor: aynı teknoloji hem saldırı potansiyeli taşıyor hem de savunmayı güçlendirebiliyor. Anthropic örneği, önümüzdeki dönemde benzer kabiliyetlere sahip başka modeller ortaya çıktığında hangi sınırların uygulanacağı sorusunu daha da kritik hale getiriyor.

