Hankali Na Gama Gari A Cikin AI Mai Tattaunawa: Nazari Akan Matsayin Fasaha Na Yanzu

1. Gabatarwa

Wannan takardar nazari ta magance babbar ƙalubale ta haɗa hankali na gama gari cikin tsarin AI mai tattaunawa na zamani. Duk da cewa ƙirar ƙira kamar BERT, GPT, da T5 sun sami nasara mai ban mamaki wajen fahimtar tsarin harshe da ma'anar mahallin, har yanzu suna fuskantar wahala a ayyukan da suke buƙatar ilimin gama gari—wato ilimin duniya da mutane suka saba ɗauka a matsayin abin da ba a buƙatar bayyanawa. Takardar ta nuna cewa wannan gibi yana hana ci gaban tsarin tattaunawa na gaske wanda ya dace da yanayin ɗan adam.

Muhimmancin hankali na gama gari ga hankalin injina an riga an gane shi, amma har yanzu ba a sami tsari gama gari na tsarawa da haɗa wannan ilimin ba. Wannan nazari ya mai da hankali kan haɗuwar hankali na gama gari da AI mai tattaunawa, yana bitar bayanan da suka dace, hanyoyi, da ma'auni na ƙima.

2. Hankali Na Gama Gari A Cikin Matsalolin AI Mai Tattaunawa

Hankali na gama gari yana da muhimmanci a ko'ina cikin AI mai tattaunawa. Takardar ta gano wasu muhimman fagage inda rashinsa ya fi bayyana.

2.1 Fahimtar Tattaunawa

Dole ne ƙirar ƙira su yi hasashen manufofin da ba a bayyana ba, su warware shubuha, da fahimtar mahallin da ba a bayyana ba. Misali, fahimtar cewa "Ina gudu zuwa kantin sayar da kayayyaki" yana nufin hanyar sufuri da niyyar siye, ba kawai motsin jiki ba.

2.2 Samar da Amsa

Samar da amsoshi masu daidaituwa, masu dacewa, da dacewa da al'ada na zamantakewa yana buƙatar sanin ka'idojin zamantakewa, dokokin zahiri, da halayen ɗan adam na yau da kullun. Ƙirar ƙira da ba ta da hankali na gama gari na iya samar da amsoshi masu yuwuwar zahiri ko rashin dacewa da al'ada.

2.3 Tattaunawa Mai Manufa

Taimaka wa masu amfani da ayyuka (misali, yin rajistar tafiye-tafiye, magance matsala) yana buƙatar yin tunani game da jerin ayyuka, dangantakar dalili da sakamako, da kaddarorin abubuwa a duniya.

3. Hanyoyin Haɗa Hankali Na Gama Gari

Nazarin ya rarraba manyan hanyoyin zuwa manyan dabarai guda uku don haɗa hankali na gama gari cikin ƙirar ƙirar AI mai tattaunawa.

3.1 Gyara Ƙirar Ƙirar (Fine-Tuning)

Wannan hanya ta ƙunshi ƙarin horar da manyan ƙirar ƙirar harshe da aka riga an horar da su akan bayanan da aka tsara musamman don ayyukan hankali na gama gari. Bayanai kamar SocialIQA, CommonsenseQA, da PIQA ana amfani da su don daidaita ƙirar ƙira don yin tunani game da hulɗar zamantakewa, kaddarorin ra'ayi, da hasashe na zahiri.

3.2 Tushe Akan Taswirar Ilimi (Knowledge-Graph Grounding)

Wannan hanyar ta haɗa maɓuɓɓukan ilimi na waje da aka tsara a fili. Takardar ta haskaka manyan taswirar ilimi (KGs) guda biyu:

ConceptNet: Cibiyar sadarwar ma'ana mai ɗauke da ilimin duniya gabaɗaya game da kalmomi da jimloli.
ATOMIC: Taswirar ilimi mai mai da hankali kan ilimin hasashe game da abubuwan da suka faru na yau da kullun, tana ɗaukar dangantakar "idan-to" game da dalilai, sakamako, da yanayin tunanin mahalarta.

An ƙirƙira ƙirar ƙira don dawo da bayanai daga waɗannan KGs da yin tunani a lokacin sarrafa tattaunawa. Ƙirar COMET, cibiyar sadarwar jijiyoyi mai tushe akan transformer da aka horar da ita akan ConceptNet da ATOMIC, an ambaci ta a matsayin babban misali mai iya samar da sabbin hasashe na gama gari.

3.3 Bayani A Cikin Harshe Na Halitta

Wata hanya mai tasowa ta ƙunshi horar da ƙirar ƙira ba kawai don samar da amsa ba har ma da samar da bayani a cikin harshe na halitta wanda ke tabbatar da amsar ta amfani da hankali na gama gari. Wannan yana nufin sanya tsarin tunanin ƙirar ƙira ya zama mafi bayyanawa kuma mai yuwuwar ƙarfi.

4. Ma'auni da Ma'aunin Ƙima

Ƙimar hankali na gama gari a cikin tattaunawa yana da rikitarwa. Takardar tana tattauna ma'auni da yawa:

Ma'auni Na Musamman: Bayanan da aka keɓe don ƙimar ƙwarewar tunani ta musamman (misali, tunanin zahiri a cikin PIQA, tunanin zamantakewa a cikin SocialIQA).
Ma'auni Na Haɗaɗɗen Tattaunawa: Ƙima a cikin manyan ayyukan tattaunawa, kamar bayanan Tattaunawar Gama Gari wanda ke gwada ko amsoshin ƙirar ƙira sun dace da gaskiyar gama gari.
Ƙimar Mutum: A ƙarshe, dacewar tattaunawa da daidaituwa, wanda mutane suka yi hukunci, ya kasance ma'auni mai mahimmanci, ko da yake na zahiri.

Ma'auni na atomatik na gama gari sun haɗa da daidaito akan tambayoyi masu zaɓi da yawa, BLEU/ROUGE don ingancin amsa, da sabbin ma'auni da aka ƙera don auna daidaiton gaskiya ko yuwuwar tunani.

5. Abubuwan Lura Na Farko Akan Ƙirar SOTA

Takardar ta gabatar da nazari na farko na manyan ƙirar ƙirar tattaunawa guda biyu: BlenderBot 3 da LaMDA. Duk da ƙwarewarsu na ci gaba, duka ƙirar ƙirar sun nuna gazawa mai mahimmanci a cikin hankali na gama gari. Misalai sun haɗa da:

Samar da amsoshi waɗanda suka saba wa dokokin zahiri na asali (misali, ba da shawarar cewa abu zai iya kasancewa a wurare biyu lokaci guda).
Rashin fahimtar alamun zamantakewa ko ka'idoji da ba a bayyana ba.
Samar da maganganun da ba su dace da gaskiya ba a cikin juzu'in tattaunawa guda ɗaya.

Waɗannan abubuwan lura suna ƙarfafa buƙatar bincike mai mai da hankali a wannan fanni, saboda irin waɗannan gazawar suna lalata amincewar mai amfani da kuma yanayin dacewar hulɗa.

Mahimmin Hasashe

Ko da mafi ƙwararrun ƙirar ƙirar tattaunawa (BlenderBot3, LaMDA) suna nuna manyan gibin a cikin hankali na gama gari, suna nuna shi a matsayin babban iyaka, ba ƙalubale na gefe ba.

6. Cikakkun Bayanai Na Fasaha da Tsarin Lissafi

Haɗa taswirar ilimi sau da yawa yana ƙunsar tsarin samarwa wanda aka ƙarfafa da dawo da bayanai. Idan aka ba da mahallin tattaunawa $C$ da taswirar ilimi $\mathcal{K}$, manufar ƙirar ƙira za a iya tsara ta a matsayin samar da amsa $R$ wanda ya ƙaru:

$P(R | C, \mathcal{K}) = \sum_{k \in \mathcal{K}_C} P(k | C) \cdot P(R | C, k)$

Inda $\mathcal{K}_C$ wani yanki ne na maɗaukakin ilimi masu dacewa da aka dawo daga $\mathcal{K}$ dangane da mahallin $C$. Kalmar $P(k | C)$ tana wakiltar yuwuwar zaɓin maɗaukakin ilimi $k$ na ƙirar dawo da bayanai, kuma $P(R | C, k)$ shine yuwuwar amsa idan aka ba da mahallin da ilimin da aka zaɓa. Ƙirar ƙira kamar COMET suna aiwatar da wannan ta hanyar gyara transformer (misali, GPT-2) akan maɗaukakin ilimin taswira da aka tsara su azaman $(head, relation, tail)$, yana ba ta damar samar da cikakkun $tail$ masu yuwuwa don sabbin tambayoyin $(head, relation)$.

7. Tsarin Nazari: Nazarin Lamari

Yanayi: Ƙimar fahimtar chatbot game da labari mai sauƙi.

Shigarwar Mai Amfani: "Na zuba kaina gilashin ruwan lemu, amma sai wayar ta yi ringi. Lokacin da na dawo, gilashin ya kasance babu kowa."

Tsarin Nazari:

Dawo da Ilimi: Ya kamata tsarin ya dawo da gaskiyar gama gari masu dacewa: Ana iya sha ruwa. Dabbobin gida (kamar kuliyoyi) suna iya sha ruwa. Mutane suna amsa wayoyi.
Samar da Hasashe: Amfani da ƙirar ƙira kamar COMET, samar da yuwuwar hasashe don lamarin "gilashin ruwan lemu da aka bar ba tare da kulawa ba": "Idan X ya bar abin sha ba tare da kulawa ba, to dabbar gida na iya sha shi" (dangantakar ATOMIC: xEffect).
Ƙimar Hasashe: Ƙima wane bayanin da aka yi hasashe ("wani ya sha shi", "ya ƙafe", "dabbar gida ta sha shi") ya fi dacewa da mahallin da yuwuwar zahiri. Daidaitaccen hasashe ya dogara da ilimin duniya da ba a bayyana ba game da abubuwan da suka faru na gida na yau da kullun.
Tsara Amsa: Samar da tambaya ko bayani mai daidaituwa: "Haba, shin kyanwarka ta isa gare shi?" sabanin wanda ba zai yuwu ba: "Shin ya zama gas?"

Wannan tsarin yana nuna matakan tunani da ake buƙata, daga dawo da bayanai zuwa hasashe zuwa haɗa mahallin.

8. Ayyuka Na Gaba da Hanyoyin Bincike

Hanyar gaba don AI mai tattaunawa mai sane da hankali na gama gari ta ƙunshi manyan hanyoyi da yawa:

Hankali Na Gama Gari Mai Nau'i Daban-daban (Multimodal): Haɗa ilimin gani, ji, da azanci tare da harshe, kamar yadda ƙirar ƙira kamar OpenAI's CLIP da DALL-E suka fara, waɗanda ke haɗa rubutu da ra'ayoyin gani. Wakilan tattaunawa na gaba na iya buƙatar yin tunani game da fage da aka kwatanta a cikin tattaunawa.
Taswirar Ilimi Mai Ƙarfi (Dynamic): Ƙaura daga KGs masu tsayayye zuwa tsarin da zai iya koyo da sabunta ilimin gama gari ci gaba da hulɗa, kamar yadda mutane suke yi.
Tunani Na Dalili (Causal): Zurfafa fahimtar ƙirar ƙira game da dalili da sakamako, babban ɓangare na hankali na gama gari. Bincike daga matakin dalili na Judea Pearl yana nuna motsawa daga haɗin gwiwa zuwa shiga tsakani da tunanin akasin haka yana da mahimmanci don AI mai ƙarfi.
Hankali Na Gama Gari Na Keɓaɓɓu da Al'adu: Haɓaka ƙirar ƙira waɗanda suka fahimci ka'idojin gama gari waɗanda suka bambanta tsakanin mutane, al'ummomi, da al'adu.
Haɗin Neuro-Symbolic: Haɗa ƙarfin gane tsarin cibiyoyin jijiyoyi (kamar transformers) tare da ƙwarewar tunani na zahiri, na ma'ana na tsarin AI na alama. Wannan hanya ta gauraye, kamar yadda ƙirar ƙirar MIT's Probabilistic Symbolic (PS) suka bincika, hanya ce mai ban sha'awa don hankali na gama gari mai yuwuwa da fassara.

9. Nassoshi

Richardson, C., & Heck, L. (2023). Commonsense Reasoning for Conversational AI: A Survey of the State of the Art. Workshop on Knowledge Augmented Methods for NLP, AAAI 2023.
Speer, R., Chin, J., & Havasi, C. (2017). ConceptNet 5.5: An Open Multilingual Graph of General Knowledge. Proceedings of AAAI.
Sap, M., et al. (2019). ATOMIC: An Atlas of Machine Commonsense for If-Then Reasoning. Proceedings of AAAI.
Bosselut, A., et al. (2019). COMET: Commonsense Transformers for Automatic Knowledge Graph Construction. Proceedings of ACL.
Gao, J., et al. (2018). Neural Approaches to Conversational AI. Foundations and Trends® in Information Retrieval.
Pearl, J., & Mackenzie, D. (2018). The Book of Why: The New Science of Cause and Effect. Basic Books.
Radford, A., et al. (2021). Learning Transferable Visual Models From Natural Language Supervision. Proceedings of ICML (CLIP).

Ra'ayin Manazarcin: Gibin Hankali Na Gama Gari

Mahimmin Hasashe: Nazarin Richardson da Heck ya bayyana gaskiya ta asali, amma sau da yawa ba a bayyana ta ba, a cikin AI na zamani: mafi ƙwararrun ƙirar ƙirar harshe masu hazaka ne masu daidaita tsari suna aiki a cikin sararin ma'ana mara komai. Sun ƙware a kan "yadda" harshe amma sun rasa "dalilin"—tsarin duniya na asali wanda ke tabbatar da ma'ana. Wannan ba ƙaramin kuskuren fasaha ba ne; lahani ne na gine-gine wanda ke iyakance amfanin AI da amincinsa a aikace-aikacen duniya na gaske. Kamar yadda marubutan suka lura, ko da manyan ƙirar ƙira kamar LaMDA da BlenderBot3 sun gaza akan ayyukan tunanin ɗan adam marasa mahimmanci, gibin da ke nuna iyakokin da aka gani a wasu fannonin AI, kamar ƙirar ƙirar hangen nesa waɗanda ba su da fahimtar zahiri duk da ƙwarewarsu na fahimta.

Tsarin Ma'ana da Ƙarfuka da Kurakurai: Ƙarfin takardar yana cikin rarrabuwar kawuna mai bayyanawa—rarraba hanyoyin zuwa Gyara Ƙirar Ƙirar, Tushe Akan Taswirar Ilimi, da Bayani. Wannan tsarin yana raba yanayin bincike mai rikitarwa da amfani. Mai da hankali kan Taswirar Ilimi kamar ConceptNet da ATOMIC ya dace; suna wakiltar mafi ƙwaƙƙwaran yunƙuri na tattara walƙiyar hankali na gama gari. Duk da haka, nazarin kuma ya nuna raunin babban fannin: dogaro ga tushen ilimi mai rauni, tsayayye, kuma a ƙarshe bai cika ba. ConceptNet, duk da cewa yana da daraja, hoto ne na yarjejeniyar gaskiya, ba shi da ƙarfi, mahallin, kuma sau da yawa sabani na ilimin duniya na gaske. Hanyar ƙirar COMET ta samar da ilimi aiki ne mai wayo, amma yana da haɗarin yin mafarki da "gaskiyar" da ke da sauti amma ba daidai ba, yana musanya wata matsala da wata. Tattaunawar ma'auni ta ƙara bayyana matsala ta meta: ba mu da ingantattun ma'auni na atomatik don ƙimar zurfin tunani, sau da yawa muna komawa ga daidaito akan tambayoyi masu zaɓi da yawa ko ƙimar kamanceceniya mara zurfi, waɗanda suke marasa inganci don fahimta ta gaske.

Abubuwan Lura Masu Aiki: Hanyar gaba ba kawai ƙara girman tsarin da ake da su ba. Na farko, dole ne fannin ya ba da fifiko ga tunani na dalili da akasin haka, ya wuce haɗin gwiwa. Kamar yadda aikin Judea Pearl ya nuna, fahimtar "menene idan" da "dalilin" shine ginshiƙin hankali mai ƙarfi. Na biyu, muna buƙatar canji zuwa haɗin neuro-symbolic. Hanyoyin jijiyoyi masu tsafta suna da ƙoshin bayanai kuma ba su da haske; tsarin alama masu tsafta suna da rauni. Ƙirar gauraye, waɗanda ke amfani da cibiyoyin sadarwar jijiyoyi don fahimta da daidaita tsari tare da injunan alama don cire ma'ana, suna ba da hanya mai ban sha'awa, ko da yake mai ƙalubale na lissafi. Cibiyoyi kamar MIT's CSAIL suna samun ci gaba a nan. A ƙarshe, dole ne ƙima ta ci gaba. Muna buƙatar ma'auni waɗanda ke gwada sarkar tunani, suna buƙatar hujja, da hukunta sabani, suna motsawa daga ayyukan juzu'i ɗaya zuwa labaran tattaunawa masu matakai da yawa waɗanda ke bayyana rashin daidaituwa na ma'ana. Makomar AI mai tattaunawa ba kawai game da ingantaccen hira ba ne; yana game da gina injuna waɗanda suke raba fahimtarmu game da duniya, manufar da ke kasancewa a waje da isa amma yanzu an bayyana ta da kyari saboda nazari irin na wannan.