Hoja ya Akili Bandia ya Jumla ya Saikometri

1. Jedwali la Yaliyomo

2. Utangulizi
3. Ufahamu Mkuu: Mabadiliko ya Mtazamo wa Saikometri
4. Mtiririko wa Mantiki: Kutoka kwa AI Nyembamba hadi Akili ya Jumla
5. Nguvu na Udhaifu: Tathmini Muhimu ya Majaribio ya AGI
6. Maarifa Yanayotekelezeka: Maelekezo ya Baadaye
7. Maelezo ya Kiufundi na Uundaji wa Hisabati
8. Matokeo ya Majaribio na Uchambuzi wa Vigezo
9. Mfumo wa Uchambuzi: Uchunguzi Kifani wa ARC
10. Matumizi ya Baadaye na Mtazamo
11. Uchambuzi na Ufafanuzi wa Asili
12. Marejeleo

2. Utangulizi

Karatasi "Hoja ya Akili Bandia ya Jumla ya Saikometri" na Mark McPherson (Chuo Kikuu cha Bournemouth, 2020) inakagua kwa kina vigezo na majaribio yaliyopo vya kupima Akili Bandia ya Jumla (AGI). Mwandishi anasema kuwa mifumo ya sasa ya AI, licha ya kufikia utendaji wa hali ya juu kuliko binadamu katika maeneo nyembamba kama Go, StarCraft, na utambuzi wa magonjwa, inakosa uwezo wa kubadilika na kujumlisha wa akili ya binadamu. Hoja kuu ni kwamba mbinu za saikometri, hasa Kundi la Kufikiri na Uondoaji (ARC) lililopendekezwa na Chollet, ndio njia yenye ahadi zaidi ya kugundua na kupima AGI.

3. Ufahamu Mkuu: Mabadiliko ya Mtazamo wa Saikometri

Ufahamu wa kimsingi wa karatasi hii ni kwamba kupima AGI kunahitaji mabadiliko ya mtazamo kutoka kwa vigezo maalum vya kazi hadi mifumo ya saikometri inayotathmini uwezo wa jumla wa utambuzi. Mwandishi anasema kuwa vigezo vya jadi vya AI (k.m., kucheza michezo, uainishaji wa picha) havitoshi kwa sababu vinapima utendaji nyembamba, maalum wa eneo badala ya akili ya jumla. Mbinu ya saikometri, iliyochochewa na upimaji wa akili ya binadamu, inazingatia kupima uwezo wa kutatua matatizo mapya katika maeneo mbalimbali bila mafunzo maalum ya kazi.

4. Mtiririko wa Mantiki: Kutoka kwa AI Nyembamba hadi Akili ya Jumla

Karatasi inafuata maendeleo ya wazi ya mantiki:

Utambuzi wa Tatizo: Mifumo ya sasa ya AI ni nyembamba na dhaifu, ikishindwa wakati mazingira yanapotoka kidogo kutoka kwa hali ya mafunzo.
Ufafanuzi wa AGI: Akili ya jumla inafafanuliwa kama uwezo wa kutekeleza kazi katika maeneo mengi, ikiwa ni pamoja na yale yasiyojulikana wakati wa uundaji.
Mapitio ya Majaribio Yaliyopo: Mwandishi anachambua majaribio sita yaliyopendekezwa na Mikhaylovskiy (Maelezo, Uwekaji wa Tatizo, Kukanusha, Utabiri wa Jambo Jipya, Uundaji wa Biashara, Uundaji wa Nadharia) na kigezo cha ARC cha Chollet.
Tathmini Muhimu: Kila jaribio linatathminiwa dhidi ya vigezo ikiwa ni pamoja na ujumla, usawa, upanuzi, na upinzani dhidi ya uchezaji.
Mapendekezo: Mbinu za saikometri, hasa ARC, zinatambuliwa kama mwelekeo wenye ahadi zaidi.

5. Nguvu na Udhaifu: Tathmini Muhimu ya Majaribio ya AGI

5.1 Nguvu za Mbinu za Saikometri

Ujumla: Kazi za ARC zinahitaji kufikiri kuhusu mifumo ya kufikirika, si maarifa maalum ya eneo.
Usawa: Utendaji unapimwa kwa mafanikio kwenye kazi zisizoonekana, kupunguza upendeleo.
Upanuzi: Seti ya data ya ARC ina kazi 800, ikiruhusu uchambuzi thabiti wa takwimu.

5.2 Udhaifu na Mapungufu

Majaribio ya Mikhaylovskiy: Majaribio ya Maelezo, Uundaji wa Nadharia, na Uundaji wa Biashara ni ya kibinadamu sana na ni magumu kuyaweka kiotomatiki kwa usawa. Yanahitaji ubunifu wa kiwango cha binadamu na mwingiliano wa ulimwengu halisi, ambayo huenda si lazima kwa AGI.
Mapungufu ya ARC: Ingawa yana ahadi, ARC inazingatia hasa kufikiri kwa kuona na huenda isikamate vipimo vingine vya akili (k.m., kijamii, lugha, au kufikiri kwa mwili).
Ukosefu wa Mienendo ya Muda: Majaribio mengi ni tuli na hayatathmini kujifunza kwa muda au kukabiliana na mazingira yanayobadilika.

6. Maarifa Yanayotekelezeka: Maelekezo ya Baadaye

Kulingana na uchambuzi, karatasi inapendekeza maelekezo kadhaa yanayotekelezeka:

Kuendeleza Vigezo Mseto: Kuchanganya kazi za saikometri na mazingira ya nguvu, shirikishi ili kutathmini kufikiri na kukabiliana.
Kujumuisha Njia Nyingi: Kupanua ARC ili kujumuisha kazi za kufikiri za lugha, kusikia, na mwili.
Kuzingatia Ujumlishaji wa Muundo: Kubuni kazi zinazohitaji kuchanganya dhana zilizojifunza kwa njia mpya, kipengele muhimu cha akili ya binadamu.
Kupitisha Ripoti Sanifu: Kutumia vipimo vya saikometri (k.m., kutegemewa, uhalali, nadharia ya majibu ya bidhaa) ili kuhakikisha vigezo vina ukali wa kisayansi.

7. Maelezo ya Kiufundi na Uundaji wa Hisabati

Mbinu ya saikometri ya kupima AGI inaweza kurasimishwa kwa kutumia Nadharia ya Majibu ya Bidhaa (IRT). Hebu $ heta$ iwakilishe akili ya jumla iliyofichika ya wakala. Uwezekano wa kutatua kwa usahihi kazi $i$ yenye ugumu $b_i$ na ubaguzi $a_i$ unatolewa na mfano wa logistiki:

$$P(X_i = 1 | heta) = \frac{1}{1 + e^{-a_i(\theta - b_i)}}$$

Kwa kigezo cha ARC, kila kazi ina jozi za gridi za pembejeo na pato. Wakala lazima atambue mageuzi ya msingi $f: \mathbb{Z}^{m \times n} \rightarrow \mathbb{Z}^{p \times q}$ kutoka kwa mifano michache na kuitumia kwa pembejeo mpya. Kipimo cha utendaji ni usahihi kwenye kazi zilizotengwa, zikiwa na uzito kulingana na ugumu wa kazi.

8. Matokeo ya Majaribio na Uchambuzi wa Vigezo

Karatasi haitoi majaribio ya asili lakini inakagua matokeo yaliyopo. Matokeo muhimu kutoka kwa fasihi ni pamoja na:

Utendaji wa Binadamu kwenye ARC: Binadamu hufikia takriban usahihi wa 80-90% kwenye kazi za ARC, ikionyesha uwezekano wa kigezo.
Utendaji wa AI: Mifumo ya kisasa ya AI (kufikia 2020) inafikia chini ya usahihi wa 30% kwenye ARC, ikionyesha pengo kati ya akili nyembamba na ya jumla.
Ulinganisho na Vigezo Vingine: ARC ni changamoto zaidi kuliko majaribio ya jadi ya IQ kwa AI kwa sababu inahitaji kufikiri kama programu badala ya kulinganisha mifumo.

Kielelezo 1: Chati ya pau dhahania ikilinganisha utendaji wa binadamu na AI kwenye kazi za ARC katika viwango vya ugumu (rahisi, wastani, ngumu). Binadamu huwashinda AI mara kwa mara, na pengo likiongezeka kwenye kazi ngumu zaidi.

9. Mfumo wa Uchambuzi: Uchunguzi Kifani wa ARC

Ili kuonyesha mbinu ya saikometri, fikiria kazi ya ARC ambapo pembejeo ni gridi ya 3x3 yenye seli za rangi, na pato ni gridi ya 3x3 yenye muundo tofauti. Wakala lazima atambue kanuni (k.m., "zungusha muundo digrii 90 kwa mwendo wa saa") kutoka kwa mifano miwili na kuitumia kwa pembejeo ya tatu.

Mfano wa Kazi:

Pembejeo 1: [[0,1,0],[1,0,1],[0,1,0]] → Pato 1: [[0,1,0],[1,0,1],[0,1,0]] (hakuna mabadiliko, ulinganifu)
Pembejeo 2: [[1,0,0],[0,1,0],[0,0,1]] → Pato 2: [[0,0,1],[0,1,0],[1,0,0]] (pindua kando ya kipenyo cha kinyume)
Pembejeo la Jaribio: [[0,0,1],[0,1,0],[1,0,0]] → Pato linalotarajiwa: [[1,0,0],[0,1,0],[0,0,1]]

Kazi hii inahitaji wakala kutambua kanuni ya mageuzi (pindua kando ya kipenyo cha kinyume) na kuitumia kwa muundo mpya. Thamani ya saikometri iko katika ukweli kwamba kanuni ni ya kufikirika na haijafungwa kwa eneo lolote maalum.

10. Matumizi ya Baadaye na Mtazamo

Mbinu ya saikometri ya AGI ina matumizi kadhaa yenye ahadi:

Usalama wa AI: Vigezo vya saikometri vinaweza kusaidia kugundua kushindwa kusikotarajiwa katika mifumo ya AI kwa kupima ujumlishaji kwa matukio mapya.
Ushirikiano wa Binadamu na AI: Kuelewa wasifu wa utambuzi wa AI (k.m., nguvu katika kufikiri kwa kuona dhidi ya lugha) kunaweza kuboresha ushirikiano na binadamu.
AI ya Kielimu: Mifumo ya saikometri inaweza kuongoza uundaji wa wakufunzi wa AI wanaojirekebisha kulingana na mitindo ya kujifunza ya mtu binafsi.
Sayansi ya Neva: Kulinganisha utendaji wa binadamu na AI kwenye kazi za saikometri kunaweza kuangazia msingi wa neva wa akili ya jumla.

Maelekezo ya baadaye ni pamoja na kuunganisha vigezo vya saikometri na mazingira ya kujifunza kwa kuimarisha, kuendeleza majaribio ya nguvu yanayojirekebisha kulingana na kiwango cha uwezo wa wakala, na kuunda vigezo vya njia nyingi vinavyotathmini kufikiri katika njia za hisia.

11. Uchambuzi na Ufafanuzi wa Asili

Karatasi inatoa hoja yenye nguvu kwa mbinu za saikometri za AGI, lakini mambo kadhaa muhimu yanastahili kuchunguzwa. Kwanza, kutegemea akili kama ya binadamu kama kiwango cha dhahabu ni cha kifalsafa chenye shaka. Kama ilivyojadiliwa na Bostrom (2014) katika "Superintelligence," AGI inaweza kuonyesha aina za akili ambazo ni tofauti kwa ubora na utambuzi wa binadamu, na kufanya vigezo vya kibinadamu viweze kupotosha. Pili, kigezo cha ARC, ingawa ni kizuri, kinaweza kuwa nyembamba sana. Kama ilivyobainishwa na Lake et al. (2017) katika "Building Machines That Learn and Think Like People," akili ya binadamu inahusisha si tu kufikiri kwa kufikirika bali pia fizikia ya angavu, utambuzi wa kijamii, na uelewa wa lugha. Kigezo cha kweli cha akili ya jumla kinapaswa kujumuisha vipimo hivi. Tatu, karatasi inapuuza uwezo wa upimaji wa uadui. Kama ilivyoonyeshwa na Goodfellow et al. (2014) katika karatasi ya awali ya GAN, mifano ya uadui inaweza kufichua udhaifu wa kimsingi katika mifumo ya AI ambao vigezo vya kawaida hukosa. Kujumuisha vipengele vya uadui katika majaribio ya saikometri kunaweza kutoa tathmini thabiti zaidi ya ujumlishaji. Hatimaye, mwelekeo wa karatasi kwenye upimaji badala ya usanifu ni nguvu, lakini una hatari ya kupuuza swali la jinsi ya kujenga AGI. Kama Yudkowsky (2008) anavyosema, tatizo la upatanishi linahitaji kuelewa taratibu za ndani za mifumo ya AI, si tu tabia zao za nje. Licha ya mapungufu haya, karatasi inatoa mfumo muhimu wa kufikiri kuhusu tathmini ya AGI na inasisitiza kwa usahihi hitaji la vigezo vikali, vyenye uhalali wa saikometri.

12. Marejeleo

McCarthy, J., et al. (1956). A Proposal for the Dartmouth Summer Research Project on Artificial Intelligence.
Silver, D., et al. (2016). Mastering the game of Go with deep neural networks and tree search. Nature, 529(7587), 484-489.
Vinyals, O., et al. (2019). Grandmaster level in StarCraft II using multi-agent reinforcement learning. Nature, 575(7782), 350-354.
Krizhevsky, A., et al. (2012). ImageNet classification with deep convolutional neural networks. NeurIPS.
Vaswani, A., et al. (2017). Attention is all you need. NeurIPS.
Esteva, A., et al. (2017). Dermatologist-level classification of skin cancer with deep neural networks. Nature, 542(7639), 115-118.
Marcus, G. (2018). Deep learning: A critical appraisal. arXiv:1801.00631.
Searle, J. (1980). Minds, brains, and programs. Behavioral and Brain Sciences, 3(3), 417-424.
Thomson, W. (1889). Popular Lectures and Addresses.
Adams, S., et al. (2012). Mapping the landscape of human-level artificial general intelligence. AI Magazine, 33(1), 25-42.
Goertzel, B. (2014). Artificial general intelligence: Concept, state of the art, and future prospects. Journal of Artificial General Intelligence, 5(1), 1-48.
Bringsjord, S., & Schimanski, B. (2003). What is artificial intelligence? Psychometric AI as an answer. IJCAI.
Mikhaylovskiy, N. (2020). Six tests for artificial general intelligence. arXiv:2005.05718.
Chollet, F. (2019). On the measure of intelligence. arXiv:1911.01547.
Bostrom, N. (2014). Superintelligence: Paths, Dangers, Strategies. Oxford University Press.
Lake, B. M., et al. (2017). Building machines that learn and think like people. Behavioral and Brain Sciences, 40, e253.
Goodfellow, I., et al. (2014). Generative adversarial nets. NeurIPS.
Yudkowsky, E. (2008). Artificial intelligence as a positive and negative factor in global risk. In Global Catastrophic Risks, Oxford University Press.