Dil Seçin

Psikometrik Yapay Genel Zeka İçin Argüman

AGI kıyaslamaları ve testlerinin eleştirel bir incelemesi, yapay zeka sistemlerinde genel zekayı ölçmek için psikometrik yaklaşımlar önermektedir.
agi-friend.com | PDF Size: 0.1 MB
Değerlendirme: 4.5/5
Değerlendirmeniz
Bu belgeyi zaten değerlendirdiniz
PDF Belge Kapağı - Psikometrik Yapay Genel Zeka İçin Argüman

1. İçindekiler

2. Giriş

Mark McPherson (Bournemouth Üniversitesi, 2020) tarafından yazılan "Psikometrik Yapay Genel Zeka İçin Argüman" başlıklı makale, Yapay Genel Zeka'yı (AGI) ölçmek için mevcut kıyaslamaları ve testleri eleştirel bir şekilde incelemektedir. Yazar, Go, StarCraft ve tıbbi teşhis gibi dar alanlarda insanüstü performans elde etmelerine rağmen, mevcut yapay zeka sistemlerinin insan zekasının uyum sağlama ve genelleme yeteneklerinden yoksun olduğunu savunmaktadır. Temel tez, özellikle Chollet tarafından önerilen Soyutlama ve Akıl Yürütme Derlemi'nin (ARC) psikometrik yaklaşımlarının, AGI'yi tespit etmek ve ölçmek için en umut verici yolu sunduğudur.

3. Temel İçgörü: Psikometrik Paradigma Değişimi

Bu makalenin temel içgörüsü, AGI'yi ölçmenin, göreve özgü kıyaslamalardan genel bilişsel yetenekleri değerlendiren psikometrik çerçevelere doğru bir paradigma değişimi gerektirmesidir. Yazar, geleneksel yapay zeka kıyaslamalarının (ör. oyun oynama, görüntü sınıflandırma) yetersiz olduğunu çünkü bunların genel zekadan ziyade dar, alana özgü performansı ölçtüğünü savunmaktadır. İnsan zekası testlerinden ilham alan psikometrik yaklaşım, göreve özgü eğitim olmaksızın çeşitli alanlardaki yeni problemleri çözme yeteneğini ölçmeye odaklanır.

4. Mantıksal Akış: Dar Yapay Zekadan Genel Zekaya

Makale net bir mantıksal ilerleme izler:

  1. Sorun Tanımlaması: Mevcut yapay zeka sistemleri dar ve kırılgandır; ortamlar eğitim koşullarından biraz saptığında başarısız olurlar.
  2. AGI Tanımı: Genel zeka, oluşturulma anında bilinmeyenler de dahil olmak üzere çok sayıda alanda görevleri yerine getirme yeteneği olarak tanımlanır.
  3. Mevcut Testlerin İncelenmesi: Yazar, Mikhaylovskiy tarafından önerilen altı testi (Açıklama, Problem Kurma, Çürütme, Yeni Olgu Tahmini, İş Yaratma, Teori Oluşturma) ve Chollet'in ARC kıyaslamasını değerlendirir.
  4. Eleştirel Değerlendirme: Her test, genellik, nesnellik, ölçeklenebilirlik ve manipülasyona karşı direnç kriterlerine göre değerlendirilir.
  5. Öneri: Psikometrik yaklaşımlar, özellikle ARC, en umut verici yön olarak belirlenmiştir.

5. Güçlü Yönler ve Kusurlar: AGI Testlerinin Eleştirel Değerlendirmesi

5.1 Psikometrik Yaklaşımların Güçlü Yönleri

5.2 Kusurlar ve Sınırlamalar

6. Uygulanabilir İçgörüler: Gelecek Yönelimler

Analize dayanarak, makale birkaç uygulanabilir yön önermektedir:

7. Teknik Detaylar ve Matematiksel Formülasyon

AGI ölçümüne yönelik psikometrik yaklaşım, Madde Tepki Kuramı (IRT) kullanılarak formüle edilebilir. $ heta$ bir ajanın gizli genel zekasını temsil etsin. Zorluğu $b_i$ ve ayırt ediciliği $a_i$ olan $i$ görevini doğru çözme olasılığı lojistik model ile verilir:

$$P(X_i = 1 | \theta) = \frac{1}{1 + e^{-a_i(\theta - b_i)}}$$

ARC kıyaslaması için her görev, girdi-çıktı ızgara çiftlerinden oluşur. Ajan, birkaç örnekten temel dönüşümü $f: \mathbb{Z}^{m \times n} \rightarrow \mathbb{Z}^{p \times q}$ çıkarmalı ve bunu yeni bir girdiye uygulamalıdır. Performans metriği, görev zorluğuna göre ağırlıklandırılmış, ayrılmış görevlerdeki doğruluktur.

8. Deneysel Sonuçlar ve Kıyaslama Analizi

Makale özgün deneyler sunmamakta, mevcut sonuçları incelemektedir. Literatürden elde edilen temel bulgular şunları içerir:

Şekil 1: Zorluk seviyelerine (kolay, orta, zor) göre ARC görevlerinde insan ve yapay zeka performansını karşılaştıran varsayımsal bir çubuk grafik. İnsanlar, zor görevlerde farkın açılmasıyla birlikte, yapay zekadan sürekli olarak daha iyi performans gösterir.

9. Analitik Çerçeve: ARC Vaka Çalışması

Psikometrik yaklaşımı göstermek için, girdinin renkli hücrelerden oluşan 3x3'lük bir ızgara olduğu ve çıktının farklı bir desene sahip 3x3'lük bir ızgara olduğu bir ARC görevini ele alalım. Ajan, iki örnekten kuralı (ör. "deseni saat yönünde 90 derece döndür") çıkarmalı ve bunu üçüncü bir girdiye uygulamalıdır.

Örnek Görev:

Bu görev, ajanın dönüşüm kuralını (ters köşegen boyunca çevir) tanımasını ve bunu yeni bir desene uygulamasını gerektirir. Psikometrik değer, kuralın soyut olması ve belirli bir alana bağlı olmaması gerçeğinde yatmaktadır.

10. Gelecek Uygulamalar ve Görünüm

AGI'ye yönelik psikometrik yaklaşımın birkaç umut verici uygulaması vardır:

Gelecek yönelimler arasında psikometrik kıyaslamaların pekiştirmeli öğrenme ortamlarıyla entegre edilmesi, ajanın yetenek seviyesine uyum sağlayan dinamik testler geliştirilmesi ve duyusal modaliteler arasında akıl yürütmeyi değerlendiren çok modlu kıyaslamalar oluşturulması yer almaktadır.

11. Özgün Analiz ve Yorum

Makale, AGI'ye yönelik psikometrik yaklaşımlar için ikna edici bir argüman sunmaktadır, ancak birkaç kritik nokta incelemeyi hak etmektedir. İlk olarak, altın standart olarak insan benzeri zekaya güvenmek felsefi olarak sorgulanabilir. Bostrom'un (2014) "Süperzeka"da tartıştığı gibi, AGI, insan bilişinden niteliksel olarak farklı zeka biçimleri sergileyebilir ve bu da insan merkezli kıyaslamaları potansiyel olarak yanıltıcı hale getirebilir. İkinci olarak, ARC kıyaslaması zarif olmakla birlikte çok dar olabilir. Lake ve diğerlerinin (2017) "İnsanlar Gibi Öğrenen ve Düşünen Makineler İnşa Etmek"te belirttiği gibi, insan zekası yalnızca soyut akıl yürütmeyi değil, aynı zamanda sezgisel fiziği, sosyal bilişi ve dil anlayışını da içerir. Gerçekten genel bir zeka kıyaslaması bu boyutları kapsamalıdır. Üçüncü olarak, makale düşmanca testlerin potansiyelini göz ardı etmektedir. Goodfellow ve diğerlerinin (2014) orijinal GAN makalesinde gösterdiği gibi, düşmanca örnekler, standart kıyaslamaların gözden kaçırdığı yapay zeka sistemlerindeki temel zayıflıkları ortaya çıkarabilir. Psikometrik testlere düşmanca unsurların dahil edilmesi, genellemenin daha sağlam bir değerlendirmesini sağlayabilir. Son olarak, makalenin mimariden ziyade ölçüme odaklanması bir güçtür, ancak AGI'nin nasıl inşa edileceği sorusunu göz ardı etme riski taşır. Yudkowsky'nin (2008) savunduğu gibi, uyum sorunu, yapay zeka sistemlerinin yalnızca dışsal davranışlarını değil, içsel mekanizmalarını anlamayı gerektirir. Bu sınırlamalara rağmen, makale AGI değerlendirmesi hakkında düşünmek için değerli bir çerçeve sunmakta ve haklı olarak titiz, psikometrik olarak geçerli kıyaslamalara olan ihtiyacı vurgulamaktadır.

12. Kaynakça

  1. McCarthy, J., ve diğerleri. (1956). A Proposal for the Dartmouth Summer Research Project on Artificial Intelligence.
  2. Silver, D., ve diğerleri. (2016). Mastering the game of Go with deep neural networks and tree search. Nature, 529(7587), 484-489.
  3. Vinyals, O., ve diğerleri. (2019). Grandmaster level in StarCraft II using multi-agent reinforcement learning. Nature, 575(7782), 350-354.
  4. Krizhevsky, A., ve diğerleri. (2012). ImageNet classification with deep convolutional neural networks. NeurIPS.
  5. Vaswani, A., ve diğerleri. (2017). Attention is all you need. NeurIPS.
  6. Esteva, A., ve diğerleri. (2017). Dermatologist-level classification of skin cancer with deep neural networks. Nature, 542(7639), 115-118.
  7. Marcus, G. (2018). Deep learning: A critical appraisal. arXiv:1801.00631.
  8. Searle, J. (1980). Minds, brains, and programs. Behavioral and Brain Sciences, 3(3), 417-424.
  9. Thomson, W. (1889). Popular Lectures and Addresses.
  10. Adams, S., ve diğerleri. (2012). Mapping the landscape of human-level artificial general intelligence. AI Magazine, 33(1), 25-42.
  11. Goertzel, B. (2014). Artificial general intelligence: Concept, state of the art, and future prospects. Journal of Artificial General Intelligence, 5(1), 1-48.
  12. Bringsjord, S., & Schimanski, B. (2003). What is artificial intelligence? Psychometric AI as an answer. IJCAI.
  13. Mikhaylovskiy, N. (2020). Six tests for artificial general intelligence. arXiv:2005.05718.
  14. Chollet, F. (2019). On the measure of intelligence. arXiv:1911.01547.
  15. Bostrom, N. (2014). Superintelligence: Paths, Dangers, Strategies. Oxford University Press.
  16. Lake, B. M., ve diğerleri. (2017). Building machines that learn and think like people. Behavioral and Brain Sciences, 40, e253.
  17. Goodfellow, I., ve diğerleri. (2014). Generative adversarial nets. NeurIPS.
  18. Yudkowsky, E. (2008). Artificial intelligence as a positive and negative factor in global risk. In Global Catastrophic Risks, Oxford University Press.