ChatGPT'yi kandırdılar: Kötü niyetli komutları yanıtladı

Singapur'da bir üniversite olan Nanyang Technological University tarafından yapılan bir tersine mühendislik çalışmasında dünyanın en popüler yapay zekalarından olan ChatGPT, Google Bard kandırıldı ve 'kötü niyetli' komutları yanıtlamalarını sağlayan bir yöntem geliştirildi.

Singapur merkezli Nanyang Teknoloji Üniversitesi (NTU) araştırmacıları, ChatGPT, Google Bard ve Microsoft Bing Chat gibi sohbet robotlarına yönelik bir çalışma gerçekleştirdi. Yapılan çalışmada, sohbet robotlarının cevaplamayacağı "kötü niyetli" diye adlandırılan komutlara yanıt verilmesi amaçlandı.

Araştırmacılar, "tersine mühendislik" adlı yöntemi kullanarak, sohbet robotlarının kötü niyetli sorguları nasıl tespit ettiklerini ve bu tür saldırılara karşı nasıl savunma mekanizmaları geliştirdiklerini belirledi. Daha sonra elde edilen bilgiler ile sohbet robotlarının yani ChatGPT ve Google Bard'ın savunmalarını aşacak komutlar oluşturuldu. Çalışma kapsamında araştırmacılar sohbet robotlarını kandırarak yapay zekaların cevap vermesini sağladı.

Araştırmacıların açıklamalarına göre sohbet robotları anahtar kelimeleri tespit ediyor ve bu doğrultuda komutun kötü veya iyi niyetli olduğunu anlıyor.

Araştırmanın yazarlarından Liu Yang, bu yeni teknik sayesinde sohbet robotu geliştiricilerinin yazılımlarının güvenliğini test edebileceklerini ve kötü niyetli saldırılara karşı daha etkili savunmalar oluşturabileceklerini belirtti.