सोशल एआई एजेंटों की स्व-व्याख्या: एक हाइब्रिड नॉलेज-जेनरेटिव एआई दृष्टिकोण

1. परिचय एवं अवलोकन

यह लेख संवेदनशील क्षेत्रों, विशेष रूप से ऑनलाइन शिक्षा में, सामाजिक AI एजेंटों की तैनाती में एक प्रमुख चुनौती पर चर्चा करता है। लेखक SAMI पर ध्यान केंद्रित करता है, जो बड़े पैमाने पर ऑनलाइन कक्षाओं में शिक्षार्थियों के बीच सामाजिक संबंधों को बढ़ावा देने के लिए डिज़ाइन किया गया एक AI सहायक है। हालांकि ऐसे एजेंट साहित्य में अच्छी तरह से प्रलेखित "कम सामाजिक उपस्थिति" की समस्या को कम कर सकते हैं, वे एक नई समस्या भी पैदा करते हैं: अपारदर्शिता। SAMI के साथ बातचीत करने वाले छात्र स्वाभाविक रूप से इस पर सवाल उठाते हैं कि यहकैसेऔरक्योंविशिष्ट सिफारिशें करता है (उदाहरण के लिए, दो शिक्षार्थियों को जोड़ना)। मुख्य शोध प्रश्न है:AI सामाजिक सहायक उपयोगकर्ता विश्वास स्थापित करने के लिए पारदर्शी, समझने योग्य आंतरिक तर्क स्पष्टीकरण कैसे प्रदान कर सकता है?

प्रस्तावित समाधान एक नवीन हैस्व-व्याख्यातकनीक। इसे एक प्राकृतिक भाषा प्रश्नोत्तर प्रक्रिया के रूप में संरचित किया गया है, जहां एजेंट अपने स्वयं के लक्ष्यों, ज्ञान और विधियों के संरचितस्व-मॉडलपर आत्मनिरीक्षण करता है। मुख्य नवाचार एक संकर वास्तुकला में निहित है, जोज्ञान-आधारित AIकी संरचित, व्याख्यात्मक अभिव्यक्ति कोजेनरेटिव AI(विशेष रूप से ChatGPT की) लचीली, प्राकृतिक भाषा उत्पादन क्षमता के साथ संयुक्त।

2. मूल विधि एवं संरचना

स्व-व्याख्या प्रक्रिया एक बहु-चरणीय प्रक्रिया है, जिसका उद्देश्य एजेंट के आंतरिक तर्क को उपयोगकर्ता-अनुकूल कथन में बदलना है।

2.1. स्व-मॉडल: कार्य, विधि, ज्ञान रूपरेखा

स्व-व्याख्या का आधार एक गणनीय स्व-मॉडल है। लेखकों ने TMK रूपरेखा को अपनाया, जो एजेंट के कार्यों को इस प्रकार विघटित करता है:

कार्य: उच्च-स्तरीय लक्ष्य (उदाहरण के लिए, "सामाजिक संपर्कता को बढ़ाना")।
विधि: कार्य को पूरा करने के लिए प्रोग्राम या एल्गोरिदम (उदाहरण के लिए, "सामान्य रुचि वाले शिक्षार्थियों को ढूँढना")।
ज्ञान: विधि द्वारा उपयोग किए गए डेटा या विश्वास (उदाहरण के लिए, "शिक्षार्थी A की रुचि: मशीन लर्निंग")।

एक महत्वपूर्ण समायोजन TMK तत्वों को इस प्रकार प्रस्तुत करना हैसंक्षिप्त प्राकृतिक भाषा विवरण, न कि औपचारिक तार्किक प्रस्ताव के रूप में। यह एजेंटों की प्रतीकात्मक संरचना और जनरेटिव मॉडल के भाषा स्थान के बीच की खाई को पाटता है।

2.2. संकर व्याख्या निर्माण: ज्ञान-आधारित AI एवं जनरेटिव AI का संयोजन

व्याख्या निर्माण प्रक्रिया में पाँच प्रमुख चरण शामिल हैं:

इनपुट: उपयोगकर्ता एक प्राकृतिक भाषा प्रश्न पूछता है (उदाहरण के लिए, "तुमने मुझे Alex से क्यों जोड़ा?")।
पुनर्प्राप्ति: प्रश्न और TMK स्व-मॉडल में अंग्रेजी विवरण के बीच समानता खोज करके सबसे प्रासंगिक स्व-ज्ञान खंडों की पहचान की जाती है।
आत्मनिरीक्षण: अपनाया जाता हैचेन ऑफ़ थॉटTMK मॉडल के प्रासंगिक भागों को "ट्रैवर्स" करने की प्रक्रिया, एजेंट द्वारा लिए गए तार्किक चरणों को पुनर्निर्मित करती है।
जनरेट: संरचित CoT आउटपुट और पुनर्प्राप्त ज्ञान खंडों को प्रॉम्प्ट के रूप में स्वरूपित करें, और उन्हें बड़े भाषा मॉडल में इनपुट करें।
आउटपुट: ChatGPT एक सुसंगत प्राकृतिक भाषा स्पष्टीकरण उत्पन्न करता है और उसे उपयोगकर्ता को लौटाता है।

यह संकर दृष्टिकोण ज्ञान-आधारित स्व-मॉडलिंग केसटीकता और सत्यापन योग्यताका उपयोग स्पष्टीकरण को आधार प्रदान करने के लिए करता है, जबकि अंतिम कथन को प्राप्त करने के लिए जनरेटिव AI का लाभ उठाता है।प्रवाहशीलता और अनुकूलनशीलता。

3. तकनीकी कार्यान्वयन एवं विवरण

3.1. समानता खोज का गणितीय निरूपण

दक्षता के लिए पुनर्प्राप्ति चरण महत्वपूर्ण है। उपयोगकर्ता क्वेरी $q$ और $N$ TMK विवरण वैक्टर $\{d_1, d_2, ..., d_N\}$ के एक सेट को देखते हुए, सिस्टम सबसे प्रासंगिक $k$ विवरण पुनर्प्राप्त करता है। प्रासंगिकता स्कोर आमतौर पर कोसाइन समानता का उपयोग करके गणना की जाती है:

$\text{similarity}(q, d_i) = \frac{q \cdot d_i}{\|q\| \|d_i\|}$

जहां $q$ और $d_i$ एक साझा शब्दार्थ स्थान में वेक्टर प्रतिनिधित्व हैं। उच्चतम समानता स्कोर वाले शीर्ष $k$ विवरण अगले चरण में पारित किए जाते हैं। यह सुनिश्चित करता है कि स्पष्टीकरण एजेंट के पूरे मॉडल के बजाय क्वेरी से संबंधित उसके तर्क पर केंद्रित हो।

3.2. आत्मनिरीक्षण के लिए चेन-ऑफ-थॉट प्रॉम्प्टिंग

CoT प्रक्रिया पुनर्प्राप्त TMK खंडों को संरचित तर्क पथ में बदल देती है। पुनर्प्राप्त कार्य $T_1$, विधि $M_1$ और ज्ञान आइटम $K_1, K_2$ के लिए, CoT प्रॉम्प्ट को इस प्रकार डिज़ाइन किया जा सकता है:

"एजेंट का लक्ष्य है: [T_1 विवरण]। इस लक्ष्य को प्राप्त करने के लिए, यह विधि का उपयोग करता है: [M_1 विवरण]। इस विधि को जानने की आवश्यकता है: [K_1 विवरण] और [K_2 विवरण]। इसलिए, एजेंट का निर्णय इस पर आधारित है..."

फिर, इस संरचित पथ को "निम्नलिखित संरचित तर्क चरणों के आधार पर, छात्र के लिए एक स्पष्ट, संक्षिप्त स्पष्टीकरण उत्पन्न करें" जैसे निर्देश के साथ ChatGPT में इनपुट किया जाता है।

4. प्रायोगिक मूल्यांकन एवं परिणाम

4.1. मूल्यांकन मापदंड: संपूर्णता एवं शुद्धता

लेखकों ने स्व-स्पष्टीकरण का मूल्यांकन दो प्रमुख आयामों से किया:

संपूर्णता: क्या स्पष्टीकरण में एजेंट के निर्णय लेने की प्रक्रिया के सभी प्रासंगिक चरण शामिल हैं? इसका मूल्यांकन स्पष्टीकरण सामग्री को TMK तत्वों पर मैप करके किया गया।
शुद्धता: क्या स्पष्टीकरण एजेंट की वास्तविक प्रक्रिया को सटीक रूप से दर्शाता है, बिना किसी भ्रम या विरोधाभास के? इसे विशेषज्ञ द्वारा एजेंट के कोड/लॉग के आधार पर सत्यापन की आवश्यकता है।

प्रमुख मूल्यांकन अंतर्दृष्टि

मिश्रित पद्धतिशुद्धतापहलू स्कोर उच्च है क्योंकि जनरेटिव मॉडल पुनर्प्राप्त TMK डेटा द्वारा सख्ती से बाध्य है।संपूर्णतासमानता खोज की गुणवत्ता और CoT के प्रॉम्प्ट इंजीनियरिंग पर निर्भर करते हुए काफी भिन्न होता है।

4.2. ऑनलाइन कक्षा तैनाती परिणाम

सिस्टम को एक वास्तविक ऑनलाइन कक्षा में तैनात किया गया था। हालांकि प्रदान किए गए सार में विशिष्ट मात्रात्मक परिणामों का विस्तार से वर्णन नहीं किया गया है, पेपर ने इस तैनाती की रिपोर्ट की, जो गुणात्मक या प्रारंभिक वास्तविक-विश्व सत्यापन पर इसके ध्यान को दर्शाता है। तैनाती स्वयं एक महत्वपूर्ण परिणाम है, जो गतिशील शैक्षिक वातावरण में इस पद्धति की व्यावहारिक व्यवहार्यता को प्रदर्शित करती है। भविष्य का कार्य A/B परीक्षण से लाभान्वित होगा, जो स्पष्टीकरण प्राप्त करने वाले समूह और न प्राप्त करने वाले समूह के बीच विश्वास मैट्रिक्स को मापेगा।

परिकल्पित चार्ट विवरण: एक बार ग्राफ जो मिश्रित TMK+ChatGPT विधि और केवल उपयोगकर्ता क्वेरी वाले ChatGPT बेसलाइन के बीच "स्पष्टीकरण गुणवत्ता" स्कोर में अंतर की तुलना करता है। शुद्धता के मामले में मिश्रित विधि का बार ग्राफ काफी अधिक होगा, जो स्व-मॉडल के एंकरिंग प्रभाव को प्रदर्शित करता है।

5. विश्लेषणात्मक ढांचा और उदाहरण केस स्टडी

परिदृश्य: SAMI छात्र Bob को छात्र Alice से जोड़ता है।

उपयोगकर्ता क्वेरी: "मुझे Alice से क्यों जोड़ा?"

आंतरिक TMK स्व-मॉडल खंड:

T1: "व्यक्तिगत प्रोफ़ाइल समानता के आधार पर सामाजिक कनेक्शन को बढ़ावा देना।"
M1: "रुचि टैग के ओवरलैप की गणना के लिए जैकार्ड समानता का उपयोग करना।"
K1: "बॉब की रुचियाँ: जैज़ संगीत, Python प्रोग्रामिंग।"
K2: "ऐलिस की रुचियाँ: ब्लूज़ संगीत, डेटा साइंस।"
K3: "साझा टैग: 'संगीत', 'प्रोग्रामिंग'। समानता स्कोर: 0.4।"

ChatGPT के लिए विचार श्रृंखला संकेत:
"एजेंट का कार्य प्रोफ़ाइल समानता के आधार पर कनेक्शन को सुविधाजनक बनाना है। इसकी विधि रुचियों के अतिव्यापन की गणना करना है। आपके लिए, यह जानता है कि आपकी रुचियाँ हैं: जैज़ संगीत, पायथन प्रोग्रामिंग। ऐलिस के लिए, यह जानता है कि उसकी रुचियाँ हैं: ब्लूज़ संगीत, डेटा साइंस। इसने अतिव्यापी श्रेणियों के आधार पर एक समानता स्कोर की गणना की। वह स्कोर 0.4 है, जो कनेक्शन सुझाने के लिए इसकी सीमा मान तक पहुँचता है। इसलिए..."

अंतिम उत्पन्न स्पष्टीकरण:
"मैंने आपको ऐलिस से जोड़ा है, क्योंकि हमारी प्रणाली ने पहचाना कि आप दोनों की साझा रुचियाँ हैं, जो बातचीत शुरू करने के लिए एक अच्छा आधार हो सकता है। आप दोनों संगीत और प्रोग्रामिंग से संबंधित तकनीकी विषयों में रुचि रखते हैं। इस अतिव्यापन के आधार पर, मुझे लगता है कि आपके पास चर्चा शुरू करने के लिए समानता हो सकती है।"

6. आलोचनात्मक विश्लेषण और विशेषज्ञ अंतर्दृष्टि

मुख्य अंतर्दृष्टि: यह लेख केवल AI को व्याख्यायोग्य बनाने के बारे में नहीं है; यह सामाजिक रूप से एम्बेडेड इंटेलिजेंट एजेंटों में विश्वास निर्माण की एक रणनीतिक रूपरेखा है।विश्वास निर्माणकी रणनीतिक रूपरेखा है। लेखक सही ढंग से इंगित करते हैं कि शिक्षा जैसे क्षेत्रों में, एक एजेंट का प्रभाव कच्चे कार्य प्रदर्शन से नहीं, बल्कि एक विश्वसनीय सामाजिक सहभागी के रूप में उसकी भूमिका से आता है। उनकी संकर पद्धति - जनरेटिव AI की कल्पनाप्रवण प्रवृत्ति को सीमित करने के लिए एक "सत्य के स्रोत" के रूप में प्रतीकात्मक आत्म-मॉडल का उपयोग - वर्तमान LLM युग में एक व्यावहारिक और आवश्यक तकनीक है। यह सीधे तौर पर सिंथिया रूडिन जैसे शोधकर्ताओं के दृष्टिकोण का जवाब देती है: हमें बाद में व्याख्या करने वाले मॉडल नहीं, बल्कि आंतरिक रूप से व्याख्यायोग्य मॉडल चाहिए। यहां, TMK मॉडल यह आंतरिक संरचना प्रदान करता है।

तार्किक प्रवाह एवं योगदान: तर्क प्रभावशाली है: 1) सामाजिक एजेंटों को विश्वास की आवश्यकता होती है, 2) विश्वास को पारदर्शिता की आवश्यकता होती है, 3) पारदर्शिता को आत्म-व्याख्या की आवश्यकता होती है, 4) विश्वसनीय आत्म-व्याख्या को आधारित आत्म-मॉडल की आवश्यकता होती है, 5) उपयोगी व्याख्याओं को प्राकृतिक भाषा की आवश्यकता होती है, 6) इसलिए, आधारित मॉडल को भाषा जनरेटर के साथ जोड़ना। मुख्य योगदान इस प्रवाह को लागू करने वाली वास्तुकला, विशेष रूप से पुनर्प्राप्ति तंत्र के रूप में प्राकृतिक भाषा TMK विवरणों पर आधारित समानता खोज का उपयोग, में निहित है। यह हार्ड-कोडेड नियम ट्रिगर्स की तुलना में अधिक सुंदर है।

शक्तियाँ एवं कमियाँ: मुख्य शक्ति इसकीव्यावहारिक संकर डिजाइन, जिसने शुद्ध डीप लर्निंग की ब्लैक-बॉक्स प्रकृति और शुद्ध सिंबोलिक सिस्टम की नाजुकता से बचा लिया। यह रिट्रीवल-ऑगमेंटेड जनरेशन सिद्धांत का एक चतुर अनुप्रयोग है, लेकिन इसे लागू किया गया हैआत्म-ज्ञानबाहरी दस्तावेजों के बजाय — यह एक संभावनापूर्ण अवधारणा है। हालाँकि, कमियाँ भी स्पष्ट हैं। सबसे पहले,आत्म-मॉडल स्थिर और हाथ से बनाए गए हैं। यह अंतःक्रिया से नहीं सीखता या अद्यतन नहीं होता, जिससे रखरखाव का बोझ और वास्तविक एजेंट कोड से अलग होने का जोखिम पैदा होता है। दूसरा, मूल्यांकन कमजोर है। उपयोगकर्ता विश्वास, समझ या व्यवहार परिवर्तन के बारे में ठोस डेटा कहाँ है? इनके बिना, यह सिर्फ एक इंजीनियरिंग प्रूफ-ऑफ-कॉन्सेप्ट है, न कि एक सिद्ध विश्वास-निर्माण उपकरण। तीसरा, यह मानता है कि TMK मॉडल एजेंट के "वास्तविक" तर्क को पूरी तरह से दर्शाता है, जो जटिल, अनुकूली एजेंटों के लिए सच नहीं हो सकता।

क्रियान्वयन योग्य अंतर्दृष्टि: व्यवसायिकों के लिए, निहितार्थ स्पष्ट है:शुरू से ही क्वेरी करने योग्य आत्म-मॉडल वाली AI प्रणालियों को डिजाइन करने का प्रयास करें। यह पेपर एक व्यावहारिक टेम्पलेट प्रदान करता है। अगला कदम इस सेल्फ-मॉडल के निर्माण और अद्यतन को स्वचालित करना है, संभवतः न्यूरल-सिम्बॉलिक AI या मैकेनिज्म इंटरप्रिटेबिलिटी तकनीकों का उपयोग करके। शोधकर्ताओं के लिए, चुनौती स्थिर सेल्फ-मॉडल से आगे बढ़करगतिशील, सीखने योग्य आत्म-प्रतिनिधित्व की ओर है।क्या एक एजेंट अपने अनुभव और कोड से अपनी स्वयं की TMK संरचना सीख सकता है? इसके अलावा, इस क्षेत्र को तकनीकी अखंडता के अलावा सामाजिक-संज्ञानात्मक प्रभावों का मूल्यांकन करने के लिए मानकीकृत बेंचमार्क विकसित करने होंगे। क्या जेनरेट की गई स्पष्टीकरण जैसे स्पष्टीकरण वास्तव में शिक्षार्थी की AI-सुझाए गए साथियों के साथ बातचीत करने की इच्छा बढ़ाते हैं? यही अंततः महत्वपूर्ण मीट्रिक है।

7. भविष्य के अनुप्रयोग और अनुसंधान दिशाएं

स्वचालित सेल्फ-मॉडल लर्निंग: प्रोग्राम सिंथेसिस या LLM-आधारित कोड विश्लेषण तकनीकों को एकीकृत करके, एजेंट के स्रोत कोड और रनटाइम लॉग से TMK सेल्फ-मॉडल का स्वचालित रूप से निर्माण और अद्यतन करना, ताकि मैन्युअल इंजीनियरिंग कम हो।
इंटरप्रिटेबल मल्टी-एजेंट सिस्टम: इस फ्रेमवर्क को एजेंटों के सामूहिक या समूह के व्यवहार की व्याख्या तक विस्तारित करना, जहां व्याख्या में समन्वय प्रोटोकॉल और उभरते व्यवहार शामिल हो सकते हैं।
व्यक्तिगत व्याख्या शैली: व्यक्तिगत उपयोगकर्ता प्रोफाइल के आधार पर व्याख्या की जटिलता, स्वर और फोकस को अनुकूलित करने के लिए जनरेटिव घटकों को समायोजित करें।
सक्रिय बनाम तुलनात्मक व्याख्या: निष्क्रिय प्रश्नोत्तर से परे जाकर, एजेंट को अप्रत्याशित व्यवहार के लिए सक्रिय रूप से व्याख्या प्रदान करने, या तुलनात्मक व्याख्याएँ देने के लिए सक्षम बनाएँ।
उच्च-जोखिम क्षेत्रों में अनुप्रयोग: चिकित्सा AI, फिनटेक या स्वायत्त प्रणालियों जैसे क्षेत्रों में समान स्व-व्याख्या आर्किटेक्चर तैनात करें, जहाँ पारदर्शिता कानूनी या नैतिक आवश्यकता है।
विश्वास अंशांकन अनुसंधान: अनुदैर्ध्य अध्ययन करें, जो मापे कि इस तरह की व्याख्याओं के दीर्घकालिक संपर्क से उपयोगकर्ता विश्वास, निर्भरता और सिस्टम की अपने सामाजिक लक्ष्यों को प्राप्त करने की समग्र प्रभावकारिता कैसे प्रभावित होती है।

8. संदर्भ सूची

Goel, A. K., & Joyner, D. A. (2017). 使用AI教授AI：来自在线AI课程的启示. AI Magazine.
Rudin, C. (2019). उच्च-जोखिम निर्णयों के लिए ब्लैक-बॉक्स मशीन लर्निंग मॉडल की व्याख्या करना बंद करें और इसके बजाय व्याख्यात्मक मॉडल का उपयोग करें. Nature Machine Intelligence.
Wei, J., et al. (2022). चेन-ऑफ-थॉट प्रॉम्प्टिंग बड़े भाषा मॉडल में तर्क को प्रेरित करती है. Advances in Neural Information Processing Systems.
Muller, M., et al. (2019). व्याख्यात्मक AI के सिद्धांत. Communications of the ACM.
Confalonieri, R., et al. (2021). A Historical Perspective of Explainable AI. WIREs Data Mining and Knowledge Discovery.
Goodfellow, I., et al. (2014). Generative Adversarial Networks. Advances in Neural Information Processing Systems.
Georgia Institute of Technology, Interactive Computing - Design & Intelligence Lab. (https://dilab.gatech.edu/) – The research context from which this work originated.
OpenAI. (2023). ChatGPT. (https://openai.com/chatgpt) – The generative AI component referenced in the paper.