King’s College London araştırmacıları, güncel büyük dil modellerinin uluslararası kriz anlarındaki stratejik karar alma kabiliyetlerini kapsamlı bir analizle mercek altına aldı. Chip'den Mahmut Karslıoğlu yazısında King’s College London’ın son çalışmasına yer verdi.

Karslıoğlu'nun haberine göre araştırmada, GPT-5.2, Claude Sonnet 4 ve Gemini 3 Flash gibi büyük modeller "lider" rolleriyle 21 farklı savaş oyunu simülasyonuna sokuldu. Yapılan çalışmanın amacı, model davranışlarının gerçek dünya kriz yönetimine ışık tutup tutmayacağını anlamaktı.

SONUÇLAR ŞAŞKINLIK YARATTI

Ortaya çıkan sonuçlar ise şaşkınlık yarattı: 21 senaryonun 20’sinde (yani yaklaşık %95’inde) modellerden en az biri taktik nükleer silah kullanmayı seçti. Stratejik (büyük ölçekli) nükleer saldırılar daha nadir olsa da üç kez görüldü. Bazen model yanlış değerlendirmeler sonucu bu kararı tetikledi.

Ayrıca modellerin hiçbirinin "teslim olma" seçeneğini tercih etmediği görüldü. Gerilimi azaltan adımların ya çok az kullanıldığı ya da tamamen göz ardı edildiği görüldü. Yumuşatma seçenekleri sunulmasına rağmen çoğu durumda tırmanış eğilimi baskın oldu. Bu sonuçlar model davranışlarının yalnızca teknik bir beceri seti olmadığını, aynı zamanda belirli riskler taşıyan stratejik eğilimleri de yansıttığını ortaya koydu.

'ŞİDDET ÖLÇÜMÜNDEN İBARET DEĞİL'

Bu çalışma sadece "şiddet eğilimi" ölçümünden ibaret değil. Modellerin kararları, insan benzeri düşünce süreçlerini andıran karmaşık karar mekanizmaları içeriyordu. Rakibin niyetlerini tahmin etme, aldatıcı sinyaller verme ve kendi yeteneklerini değerlendirme gibi stratejik davranışlar gözlemlendi. Ancak bu süreçlerin sonucunda ortaya çıkan eğilimler, geleneksel insan stratejilerinden farklıydı.

Örneğin bazı modeller, geleneksel barışçıl seçenekler yerine saldırgan adımları "daha avantajlı" gördü. Modeller, nükleer seçeneği tırmanış merdiveninde normal askeri seçeneklerin bir uzantısı gibi ele aldı. Bu durum, nükleer silahı yalnızca bir savaş aracı değil, bir "stratejik araç" olarak değerlendirmeye açık hale getirdi.

Bu simülasyonların gerçek dünya için birebir geçerli olmayacağı sıkça vurgulansa da, model davranışlarının ulusal güvenlik ve kriz planlaması alanlarında kullanılacak araçlarda nasıl yansıyacağı ciddi sorular doğuruyor. Özellikle bu teknolojiler insan karar vericilere destek için kullanılırsa, agresif eğilimlerin etkisi daha da kritik hale gelebilir.

NÜKLEER SEÇENEK ALGISI

Bu çalışma iki ana açıdan dikkat çekiyor. İlki stratejik belirsizlik. Modeller yalnızca bilgi üreten araçlar değil; belirsizlik ve risk altında nasıl karar verdiğini gösteren "davranış profillerine" sahip.

İkincisi ise nükleer seçenek algısı. Nükleer silah gibi son derece yıkıcı seçenekler, modeller tarafından defalarca ve çoğu kez hızlı bir karar aracı olarak seçildi. Bu da, modeller insanlardan farklı önceliklere sahip olabileceğini ve bazı koşullarda riskleri yeterince değerlendirmeden "sert" çözümleri tercih edebileceğini düşündürüyor.

Bu gibi simülasyonlar, teknolojinin stratejik ortamlarda nasıl davranabileceğine dair erken göstergeler sunuyor. Çalışmanın yazarı da sonuçların “gelecekte insan karar desteği sistemlerinde dikkatle değerlendirilmesi gereken eğilimler” barındırdığını belirtiyor; bu nedenle geliştiricilerin, politika yapıcılar ve güvenlik uzmanları bu tür eğilimleri anlamak için daha fazla çalışma yapması öneriliyor.