Centaur AI’nin Zihin Taklidi: Gerçek Anlayış mı, Sadece Örüntü Hafızası mı?
Yapay zeka alanındaki yeni bir model, insan bilişini taklit etme iddiasıyla gündeme geldi, ancak son araştırmalar bu iddiaların çoğunun sadece veri örüntülerini ezberlediğini ortaya koydu.
2025 yılının yaz aylarında, Nature dergisinde yayımlanan bir çalışma, insan zihninin tek bir teoriyle açıklanıp açıklanamayacağı sorusuna yeni bir bakış açısı getirdi. Psikologların uzun süredir tartıştığı bir konu olan zihnin tek bir bütün olarak mı yoksa dikkat, hafıza gibi ayrı fonksiyonlar halinde mi çalıştığı, şimdi yapay zeka (AI) ile yeniden değerlendiriliyor. Bu bağlamda, "Centaur" adlı bir AI modeli, insan bilişini taklit etme iddiasıyla dikkatleri üzerine çekti.
Centaur, standart büyük dil modelleri üzerine kurulu ve psikolojik deneylerden elde edilen verilerle ince ayar yapılmış bir yapay zeka sistemidir. Model, karar verme, yürütücü kontrol ve diğer zihinsel süreçler dahil olmak üzere 160 farklı bilişsel görevde başarılı performans sergiledi. Bu sonuçlar, AI sistemlerinin insan düşüncesini daha geniş ölçekte yeniden üretme potansiyeline dair umutları tazeledi. Ancak, bu iddiaların gerçekliği, yeni bir araştırma tarafından sorgulandı.
Zhejiang Üniversitesi araştırmacıları, National Science Open dergisinde yayımladıkları bir çalışmada, Centaur’ın başarısının aşırı uyum (overfitting) sonucu ortaya çıktığını öne sürdü. Modelin, görevleri gerçekten anladığı varsayımı yerine, eğitim verilerindeki örüntüleri tanıyarak beklenen cevapları ürettiği iddia edildi. Bu hipotezi test etmek için araştırmacılar, orijinal çoktan seçmeli sorular yerine "Lütfen A seçeneğini seçin." talimatını kullanan yeni değerlendirme senaryoları oluşturdu. Eğer model gerçekten görevi anlasaydı, sürekli olarak A seçeneğini seçmesi beklenirdi; fakat Centaur, orijinal veri setindeki "doğru" cevapları seçmeye devam etti. Bu davranış, modelin soruların anlamını değil, istatistiksel örüntüleri kullandığını gösterdi. Araştırmacılar, bu durumu, materyali anlamadan sınav formatını ezberleyen bir öğrenciyle benzerlik gösterdi.
Bu bulgular, büyük dil modellerinin yeteneklerini değerlendirirken dikkatli olunması gerektiğini vurguluyor. Veri uyumunun yüksek olması, modelin çıktılarının nasıl üretildiğini anlamayı zorlaştırıyor. Bu durum, modelin "kara kutu" doğası nedeniyle yanılmalar (hallucinations) veya yanlış yorumlamalar gibi sorunlara yol açabiliyor. Gerçek becerilerin ortaya çıkıp çıkmadığını belirlemek için kapsamlı ve çeşitli test senaryoları gereklidir. Özellikle dil anlama yeteneği, Centaur’ın en büyük sınırlaması olarak belirlendi. Model, soruların ardındaki niyeti tanımakta zorlanıyor ve bu da insan bilişini tam olarak taklit etme hedefine ulaşmasını engelliyor.
Sonuç olarak, Centaur’ın insan zihnini taklit etme iddiası, yapay zeka araştırmalarında önemli bir dönüm noktası olarak görülse de, yeni araştırmalar bu iddiaların çoğunun sadece örüntü ezberlemesine dayandığını gösterdi. Gerçek dil anlayışı ve bilişsel yetkinlik, AI sistemlerinin insan zihnini tam anlamıyla modellemesi için hâlâ çözülmesi gereken temel zorluklar arasında yer alıyor.