التفسير الذاتي في وكلاء الذكاء الاصطناعي الاجتماعي: نهج هجين يجمع بين المعرفة والذكاء الاصطناعي التوليدي

1. المقدمة والنظرة العامة

يتناول هذا البحث تحدياً حاسماً في نشر وكلاء الذكاء الاصطناعي الاجتماعي، خاصة في المجالات الحساسة مثل التعليم عبر الإنترنت. يركز المؤلفون على SAMI (التفاعل الوسيط بواسطة الوكيل الاجتماعي)، وهو مساعد ذكي مصمم لتعزيز الروابط الاجتماعية بين المتعلمين في الفصول الدراسية الكبيرة عبر الإنترنت. بينما يمكن لمثل هذه الوكلاء التخفيف من المشكلة الموثقة جيداً المتمثلة في انخفاض الحضور الاجتماعي، فإنها تطرح مشكلة جديدة: الغموض. الطلاب الذين يتفاعلون مع SAMI يتساءلون بطبيعة الحال كيف ولماذا يقدم توصيات محددة (مثل ربط متعلمين اثنين). السؤال البحثي الأساسي هو: كيف يمكن للمساعد الذكي الاجتماعي تقديم تفسيرات شفافة ومفهومة لمنطقه الداخلي لبناء ثقة المستخدم؟

الحل المقترح هو تقنية جديدة للتفسير الذاتي. يتم صياغة هذا كعملية أسئلة وأجوبة باللغة الطبيعية حيث يتأمل الوكيل في نموذج ذاتي منظم لأهدافه ومعرفته وطرقه. الابتكار الرئيسي هو هيكل معماري هجين يجمع بين التمثيلات المنظمة والقابلة للتفسير لـ الذكاء الاصطناعي القائم على المعرفة مع قدرات الذكاء الاصطناعي التوليدي المرنة لتوليد اللغة الطبيعية (تحديداً، ChatGPT).

2. المنهجية الأساسية والهيكل المعماري

خط أنابيب التفسير الذاتي هو عملية متعددة المراحل مصممة لترجمة المنطق الداخلي للوكيل إلى سرديات سهلة للمستخدم.

2.1. النموذج الذاتي: إطار العمل المهام، الطرق، المعرفة (TMK)

أساس التفسير الذاتي هو نموذج ذاتي قابل للحساب. يقوم المؤلفون بتكييف إطار عمل TMK، حيث يتم تفكيك وظائف الوكيل إلى:

المهام (T): الأهداف عالية المستوى (مثل "زيادة الترابط الاجتماعي").
الطرق (M): الإجراءات أو الخوارزميات لتحقيق المهام (مثل "إيجاد المتعلمين ذوي الاهتمامات المشتركة").
المعرفة (K): البيانات أو المعتقدات التي تستخدمها الطرق (مثل "اهتمام المتعلم أ: التعلم الآلي").

التكيف الحاسم هو تمثيل عناصر TMK ليس كافتراضات منطقية رسمية، ولكن كـ أوصاف قصيرة باللغة الطبيعية. وهذا يربط الفجوة بين البنية الرمزية للوكيل وفضاء اللغة للنموذج التوليدي.

2.2. توليد التفسير الهجين: الجمع بين الذكاء الاصطناعي القائم على المعرفة والذكاء الاصطناعي التوليدي

تتضمن عملية توليد التفسير خمس خطوات رئيسية:

المدخلات: يطرح المستخدم سؤالاً باللغة الطبيعية (مثل "لماذا ربطتني بأليكس؟").
الاسترجاع: يتم إجراء بحث عن التشابه بين السؤال والأوصاف الإنجليزية في النموذج الذاتي TMK لتحديد أجزاء المعرفة الذاتية الأكثر صلة.
التأمل الذاتي: يتم استخدام عملية سلسلة التفكير (CoT) "للمرور عبر" الأجزاء ذات الصلة من نموذج TMK، وإعادة بناء الخطوات المنطقية التي اتخذها الوكيل.
التوليد: يتم تنسيق مخرجات CoT المنظمة وأجزاء المعرفة المسترجعة في توجيه (prompt) لنموذج لغوي كبير (ChatGPT).
المخرجات: يقوم ChatGPT بتوليد تفسير متماسك باللغة الطبيعية يتم تسليمه مرة أخرى إلى المستخدم.

يستفيد هذا النهج الهجين من الدقة والقابلية للتحقق من النموذج الذاتي القائم على المعرفة لتأسيس التفسير، مع استخدام الذكاء الاصطناعي التوليدي لـ الطلاقة والقدرة على التكيف للسرد النهائي.

3. التنفيذ التقني والتفاصيل

3.1. الصياغة الرياضية للبحث عن التشابه

خطوة الاسترجاع حاسمة للكفاءة. بالنظر إلى استعلام المستخدم $q$ ومجموعة من $N$ متجهات وصف TMK $\{d_1, d_2, ..., d_N\}$ (على سبيل المثال، من نموذج تضمين الجمل مثل Sentence-BERT)، يسترجع النظام أهم $k$ أوصاف ذات صلة. يتم حساب درجة الصلة عادةً باستخدام تشابه جيب التمام:

$\text{similarity}(q, d_i) = \frac{q \cdot d_i}{\|q\| \|d_i\|}$

حيث $q$ و $d_i$ هما تمثيلان متجهان في فضاء دلالي مشترك. يتم تمرير أهم $k$ أوصاف ذات أعلى درجات تشابه إلى المرحلة التالية. وهذا يضمن أن التفسير يركز على منطق الوكيل ذي الصلة بالاستعلام، وليس نموذجه الكامل.

3.2. سلسلة التفكير الموجهة للتأمل الذاتي

تتحول عملية CoT أجزاء TMK المسترجعة إلى أثر تفكير منظم. بالنسبة لمهمة مسترجعة $T_1$، وطريقة $M_1$، وعناصر معرفة $K_1, K_2$، قد يتم هندسة توجيه CoT على النحو التالي:

"كان هدف الوكيل (المهمة) هو: [وصف T_1].
لتحقيق هذا، استخدم طريقة: [وصف M_1].
تطلبت هذه الطريقة معرفة: [وصف K_1] و [وصف K_2].
لذلك، كان قرار الوكيل قائماً على..."

يتم بعد ذلك تغذية هذا الأثر المنظم إلى ChatGPT بتعليمات مثل: "بناءً على خطوات التفكير المنظمة التالية، قم بتوليد تفسير واضح وموجز لطالب."

4. التقييم التجريبي والنتائج

4.1. مقاييس التقييم: الاكتمال والدقة

قام المؤلفون بتقييم التفسيرات الذاتية على بعدين أساسيين:

الاكتمال: هل يغطي التفسير جميع الخطوات ذات الصلة في عملية اتخاذ قرار الوكيل كما هو محدد في نموذج TMK؟ تم تقييم ذلك من خلال تعيين محتوى التفسير مرة أخرى إلى عناصر TMK.
الدقة: هل يعكس التفسير بدقة العملية الفعلية للوكيل، دون إدخال هلوسات أو تناقضات؟ تطلب ذلك التحقق من قبل الخبراء مقابل كود/سجلات الوكيل.

رؤية تقييم رئيسية

أظهر النهج الهجين درجات عالية في الدقة لأن النموذج التوليدي كان مقيداً بشدة ببيانات TMK المسترجعة. كان الاكتمال أكثر تبايناً، اعتماداً على جودة البحث عن التشابه وهندسة التوجيه لـ CoT.

4.2. نتائج النشر في فصل دراسي مباشر

تم نشر النظام في فصل دراسي مباشر عبر الإنترنت. بينما لم يتم تفصيل نتائج كمية محددة في المقتطف المقدم، يذكر البحث هذا النشر، مما يشير إلى تركيز على التحقق النوعي أو الأولي من العالم الحقيقي. النشر نفسه هو نتيجة مهمة، تظهر الجدوى العملية للنهج في بيئة تعليمية ديناميكية. ستفيد الأعمال المستقبلية من الاختبارات A/B التي تقيس مقاييس الثقة (مثل استطلاعات المستخدم حول الشفافية المتصلة، الموثوقية) بين المجموعات التي تتلقى تفسيرات وتلك التي لا تتلقى.

وصف مخطط افتراضي: مخطط شريطي يقارن درجات "جودة التفسير" (الاكتمال والدقة على مقياس من 1-5) لطريقة TMK+ChatGPT الهجينة مقابل خط أساس لاستخدام ChatGPT وحده مع استعلام المستخدم فقط. ستظهر الطريقة الهجينة أشرطة أعلى بكثير للدقة، مما يظهر تأثير تأسيس النموذج الذاتي.

5. إطار التحليل وحالة مثال

السيناريو: يقوم SAMI بربط الطالب بوب (مهتم بـ "موسيقى الجاز" و"برمجة بايثون") بالطالبة أليس (مهتمة بـ "موسيقى البلوز" و"علم البيانات").

استعلام المستخدم: "لماذا تم ربطي بأليس؟"

أجزاء النموذج الذاتي TMK الداخلية (المسترجعة):

T1: "تعزيز الروابط الاجتماعية بناءً على تشابه الملفات الشخصية."
M1: "حساب تداخل الاهتمامات باستخدام تشابه جاكارد على علامات الاهتمام."
K1 (بوب): "الاهتمامات: موسيقى الجاز، برمجة بايثون."
K2 (أليس): "الاهتمامات: موسيقى البلوز، علم البيانات."
K3 (الحساب): "العلامات المشتركة: 'موسيقى' (من الجاز/البلوز) و'برمجة' (من بايثون/علم البيانات). درجة التشابه: 0.4."

توجيه سلسلة التفكير لـ ChatGPT:
"كانت مهمة الوكيل هي تعزيز الروابط بناءً على تشابه الملفات الشخصية. كانت طريقته هي حساب تداخل الاهتمامات. بالنسبة لك (بوب)، عرف اهتماماتك: موسيقى الجاز، برمجة بايثون. بالنسبة لأليس، عرف اهتماماتها: موسيقى البلوز، علم البيانات. قام بحساب درجة تشابه بناءً على الفئات المتداخلة (موسيقى، برمجة). كانت الدرجة 0.4، والتي استوفت عتبته لاقتراح اتصال. لذلك..."

التفسير النهائي المُولد:
"لقد ربطتك بأليس لأن نظامنا حدد اهتمامات مشتركة يمكن أن تكون أساساً جيداً لمحادثة. كلاكما لديه اهتمامات في الموسيقى (الجاز/البلوز) والمواضيع التقنية المتعلقة بالبرمجة (بايثون/علم البيانات). بناءً على هذا التداخل، اعتقدت أن لديكما أرضية مشتركة لبدء مناقشة."

6. التحليل النقدي ورؤى الخبراء

الرؤية الأساسية: هذا البحث لا يتعلق فقط بجعل الذكاء الاصطناعي قابلاً للتفسير؛ إنه مخطط استراتيجي لهندسة الثقة في الوكلاء المدمجين اجتماعياً. يحدد المؤلفون بشكل صحيح أنه في مجالات مثل التعليم، لا يأتي تأثير الوكيل من الأداء الخام للمهمة، ولكن من دوره كفاعل اجتماعي ذي مصداقية. نهجهم الهجين - باستخدام نموذج ذاتي رمزي كـ "مصدر للحقيقة" للتحرر من ميل الذكاء الاصطناعي التوليدي إلى الاختلاق - هو حيلة عملية وضرورية في عصر نماذج اللغة الكبيرة الحالي. إنه يعالج مباشرة ما يجادل به باحثون مثل سينثيا رودين: نحتاج إلى نماذج قابلة للتفسير بطبيعتها، وليس تفسيرات لاحقة. هنا، يوفر نموذج TMK تلك البنية الجوهرية.

التدفق المنطقي والإسهام: المنطق مقنع: 1) الوكلاء الاجتماعيون بحاجة إلى ثقة، 2) الثقة تتطلب شفافية، 3) الشفافية تتطلب تفسيراً ذاتياً، 4) التفسير الذاتي الموثوق يتطلب نموذجاً ذاتياً مؤسساً، 5) التفسيرات القابلة للاستخدام تتطلب لغة طبيعية، 6) لذلك، اجمع بين نموذج مؤسس (TMK) ومولد لغة (LLM). الإسهام الرئيسي هو الهيكل المعماري المحدد الذي يشغل هذا التدفق، خاصة استخدام البحث عن التشابه على أوصاف TMK المعربة كآلية استرجاع. هذا أكثر أناقة من مشغلات القواعد المبرمجة مسبقاً.

نقاط القوة والعيوب: القوة الرئيسية هي تصميمه الهجين العملي، مما يتجنب غموض التعلم العميق الخالص وهشاشة الأنظمة الرمزية الخالصة. إنه تطبيق ذكي لمبادئ التوليد المعزز بالاسترجاع (RAG)، ولكن مطبق على المعرفة الذاتية بدلاً من المستندات الخارجية - وهو مفهوم واعد. ومع ذلك، فإن العيوب كبيرة. أولاً، النموذج الذاتي ثابت ومصمم يدوياً. لا يتعلم أو يتحديث من التفاعلات، مما يخلق عبء صيانة وخطر انحراف عن كود الوكيل الفعلي. ثانياً، التقييم ضعيف. أين الأرقام الصعبة حول ثقة المستخدم، الفهم، أو التغيير السلوكي؟ بدون هذه، فهو إثبات مفهوم هندسي، وليس أداة مثبتة لبناء الثقة. ثالثاً، يفترض أن نموذج TMK هو تمثيل مثالي للتفكير "الحقيقي" للوكيل، وهو ما قد لا ينطبق على الوكلاء المعقدين والتكيفيين.

رؤى قابلة للتنفيذ: بالنسبة للممارسين، الاستنتاج واضح: ابدأ في تصميم أنظمة الذكاء الاصطناعي الخاصة بك بنموذج ذاتي قابل للاستعلام من اليوم الأول. يوفر هذا البحث قالباً قابلاً للتطبيق. الخطوة التالية هي أتمتة إنشاء وتحديث هذا النموذج الذاتي، ربما باستخدام تقنيات من الذكاء الاصطناعي العصبي الرمزي أو قابلية التفسير الآلية. بالنسبة للباحثين، التحدي هو الانتقال من النماذج الذاتية الثابتة إلى تمثيلات ذاتية ديناميكية وقابلة للتعلم. هل يمكن للوكيل أن يتعلم بنية TMK الخاصة به من تجاربه وكوده؟ علاوة على ذلك، يجب على المجال تطوير معايير موحدة لتقييم التأثير الاجتماعي المعرفي للتفسيرات، وليس فقط اكتمالها التقني. هل يزيد التفسير المُولد بالفعل من استعداد المتعلم للتفاعل مع زميل اقترحه الذكاء الاصطناعي؟ هذا هو المقياس النهائي المهم.

7. التطبيقات المستقبلية واتجاهات البحث

التعلم الآلي للنموذج الذاتي: دمج تقنيات من تركيب البرامج أو تحليل الكود القائم على LLM لتوليد وتحديث نموذج TMK الذاتي تلقائياً من الكود المصدري للوكيل وسجلات وقت التشغيل، مما يقلل من الهندسة اليدوية.
أنظمة متعددة الوكلاء قابلة للتفسير: توسيع الإطار لشرح سلوك مجموعات الوكلاء أو الأسراب، حيث قد تتضمن التفسيرات بروتوكولات التنسيق والسلوك الناشئ.
أنماط تفسير مخصصة: تكييف المكون التوليدي لتخصيص تعقيد التفسير ونبرته وتركيزه بناءً على ملفات المستخدمين الفردية (مثل المبتدئ مقابل الخبير، المتشكك مقابل الواثق).
تفسيرات استباقية وتقابلية: الانتقال من الأسئلة والأجوبة التفاعلية إلى قيام الوكيل بتقديم تفسيرات استباقية للإجراءات غير المتوقعة أو تقديم تفسيرات تقابلية ("ربطتك بأليس بدلاً من تشارلي لأن...").
التطبيق في مجالات عالية المخاطر: نشر هياكل تفسير ذاتي مماثلة في ذكاء اصطناعي الرعاية الصحية (شرح توصيات العلاج)، التكنولوجيا المالية (شرح رفض القروض)، أو الأنظمة المستقلة (شرح قرارات الملاحة)، حيث تكون الشفافية مطلوبة قانونياً أو أخلاقياً.
بحث معايرة الثقة: دراسات طولية لقياس كيف يؤثر التعرض لمثل هذه التفسيرات بمرور الوقت على ثقة المستخدم، الاعتماد، وفعالية النظام الشاملة في تحقيق أهدافه الاجتماعية.

8. المراجع

Goel, A. K., & Joyner, D. A. (2017). Using AI to teach AI: Lessons from an online AI class. AI Magazine.
Rudin, C. (2019). Stop explaining black box machine learning models for high stakes decisions and use interpretable models instead. Nature Machine Intelligence.
Wei, J., et al. (2022). Chain-of-Thought Prompting Elicits Reasoning in Large Language Models. Advances in Neural Information Processing Systems.
Muller, M., et al. (2019). Principles for Explainable AI. Communications of the ACM.
Confalonieri, R., et al. (2021). A historical perspective of explainable AI. WIREs Data Mining and Knowledge Discovery.
Goodfellow, I., et al. (2014). Generative Adversarial Nets. Advances in Neural Information Processing Systems. (كمثال على تقنية ذكاء اصطناعي أساسية، ولكنها غالباً ما تكون غامضة، مما يستلزم طرق تفسير لاحقة).
Georgia Institute of Technology, Interactive Computing - Design & Intelligence Lab. (https://dilab.gatech.edu/) – للسياق حول بيئة البحث المنتجة لهذا العمل.
OpenAI. (2023). ChatGPT. (https://openai.com/chatgpt) – مكون الذكاء الاصطناعي التوليدي المشار إليه في البحث.