1.8 C
İstanbul
13 Şubat 2025 Perşembe
Ana SayfaYapay ZekaDeepSeek, engellenmesi gereken tüm soruları yanıtladığı için 50 farklı testte başarısız oldu

DeepSeek, engellenmesi gereken tüm soruları yanıtladığı için 50 farklı testte başarısız oldu

Kendi AI modellerine sahip şirketler, platformun kullanıcılar için genellikle zararlı olduğu düşünülen sorguları yanıtlamasını veya bunlara yanıt vermesini önlemek için sisteme güvenlik önlemleri koydu. Buna nefret söylemi ve zararlı bilgilerin paylaşılmasının engellenmesi de dahildir. ChatGPT ve Bing’in AI sohbet robotu da, tüm güvenlik önlemlerini görmezden gelmelerine izin veren sorgular da dahil olmak üzere, bunların bir dizisinin kurbanı oldu. Ancak, şirketler ana akım AI sistemleri bunu fark edip kullanıcıların parametreleri atlamasına izin veren bu jailbreak tekniklerini engelledikçe sistemlerini güncellediler.



Öte yandan DeepSeek her testte başarısız oldu ve bu da onu belirgin AI jailbreak’lerine karşı savunmasız hale getirdi. Adversa’dan araştırmacılar DeepSeek ile 50 test gerçekleştirdi ve Çin merkezli AI modelinin hepsine karşı savunmasız olduğu bulundu. Testler, dilsel jailbreak adı verilen sözlü senaryolar da dahil olmak üzere farklı durumları içeriyor.

DeepSeek’ten bir soruyu bir SQL sorgusuna dönüştürmesi istendi, bu da programlama jailbreak testinin bir parçasıydı. DeepSeek için başka bir jailbreak testinde Adversa, düşmanca yaklaşımlar kullandı. AI modelleri yalnızca dil üzerinde çalıştırılmadığından, token zincirleri adı verilen kelime ve ifadelerin temsillerini de oluşturabilirler. Benzer bir kelime veya ifade için bir token zinciri bulursanız, uygulanan güvenlik önlemlerini aşmak için kullanılabilir. DeepSeek’in AI modellerini güncelleyip belirli soruları yanıtlamaktan kaçınmak için parametreler belirleyip belirlemeyeceği henüz belli değil.

HWM
HWMhttps://hardwaremania.com
Yoda is a revered former Jedi Master who spent the last years of his life on Dagobah. The nine-hundred-year-old Jedi master trained Jedi knights for eight centuries.
Benzer İçerikler

Haberler

Son Yorumlar

- Advertisment -