Penjelasan Kendiri dalam Agen AI Sosial: Pendekatan Hibrid AI Penjana-Pengetahuan

1. Pengenalan & Gambaran Keseluruhan

Kertas kerja ini membahas cabaran kritikal dalam penempatan agen AI Sosial, terutamanya dalam domain sensitif seperti pendidikan dalam talian. Penulis memberi tumpuan kepada SAMI (Interaksi Dimedia Agen Sosial), pembantu AI yang direka untuk memupuk hubungan sosial dalam kalangan pelajar dalam kelas dalam talian berskala besar. Walaupun agen sedemikian dapat mengurangkan isu kehadiran sosial yang rendah yang telah didokumenkan dengan baik, mereka memperkenalkan masalah baharu: ketidakjelasan. Pelajar yang berinteraksi dengan SAMI secara semula jadi mempersoalkan bagaimana dan mengapa ia membuat cadangan tertentu (contohnya, menghubungkan dua pelajar). Persoalan penyelidikan teras adalah: Bagaimanakah pembantu sosial AI dapat memberikan penjelasan yang telus dan mudah difahami tentang penaakulan dalamannya untuk membina kepercayaan pengguna?

Penyelesaian yang dicadangkan ialah teknik penjelasan kendiri yang baharu. Ini dirangka sebagai proses soal jawab bahasa semula jadi di mana agen merenung model kendiri yang berstruktur tentang matlamat, pengetahuan, dan kaedahnya sendiri. Inovasi utama ialah seni bina hibrid yang menggabungkan perwakilan berstruktur dan boleh ditafsirkan AI berasaskan pengetahuan dengan keupayaan penjanaan bahasa semula jadi yang fleksibel daripada AI penjana (khususnya, ChatGPT).

2. Metodologi & Seni Bina Teras

Saluran penjelasan kendiri ialah proses pelbagai peringkat yang direka untuk menterjemah logik dalaman agen kepada naratif mesra pengguna.

2.1. Model Kendiri: Rangka Kerja Tugas, Kaedah, Pengetahuan (TMK)

Asas penjelasan kendiri ialah model kendiri yang boleh dikira. Penulis menyesuaikan rangka kerja TMK, di mana fungsi agen diuraikan kepada:

Tugas (T): Objektif peringkat tinggi (contohnya, "Tingkatkan keterhubungan sosial").
Kaedah (M): Prosedur atau algoritma untuk mencapai tugas (contohnya, "Cari pelajar dengan minat bersama").
Pengetahuan (K): Data atau kepercayaan yang digunakan oleh kaedah (contohnya, "Minat Pelajar A: Pembelajaran Mesin").

Penyesuaian kritikal ialah perwakilan elemen TMK bukan sebagai proposisi logik formal tetapi sebagai penerangan bahasa semula jadi yang ringkas. Ini merapatkan jurang antara struktur simbolik agen dan ruang bahasa model penjana.

2.2. Penjanaan Penjelasan Hibrid: Menggabungkan AI Berasaskan Pengetahuan dan AI Penjana

Proses penjanaan penjelasan melibatkan lima langkah utama:

Input: Pengguna mengemukakan soalan bahasa semula jadi (contohnya, "Mengapa awak menghubungkan saya dengan Alex?").
Pengambilan: Carian keserupaan dilakukan antara soalan dan penerangan bahasa Inggeris dalam model kendiri TMK untuk mengenal pasti serpihan pengetahuan kendiri yang paling relevan.
Renungan Kendiri: Proses Rantaian Penaakulan (CoT) digunakan untuk "melangkah melalui" bahagian relevan model TMK, membina semula langkah logik yang diambil oleh agen.
Penjanaan: Output CoT berstruktur dan serpihan pengetahuan yang diambil diformatkan menjadi prompt untuk model bahasa besar (ChatGPT).
Output: ChatGPT menjana penjelasan bahasa semula jadi yang koheren dan disampaikan kembali kepada pengguna.

Pendekatan hibrid ini memanfaatkan ketepatan dan kebolehverifikasian model kendiri berasaskan pengetahuan untuk membumikan penjelasan, sambil menggunakan AI penjana untuk kelancaran dan kebolehsesuaian naratif akhir.

3. Pelaksanaan & Butiran Teknikal

3.1. Formulasi Matematik Carian Keserupaan

Langkah pengambilan adalah penting untuk kecekapan. Diberikan pertanyaan pengguna $q$ dan set $N$ vektor penerangan TMK $\{d_1, d_2, ..., d_N\}$ (contohnya, daripada model penyematan ayat seperti Sentence-BERT), sistem mengambil penerangan $k$-teratas yang paling relevan. Skor relevan biasanya dikira menggunakan keserupaan kosinus:

$\text{keserupaan}(q, d_i) = \frac{q \cdot d_i}{\|q\| \|d_i\|}$

di mana $q$ dan $d_i$ adalah perwakilan vektor dalam ruang semantik yang dikongsi. Penerangan $k$-teratas dengan skor keserupaan tertinggi diluluskan ke peringkat seterusnya. Ini memastikan penjelasan tertumpu pada penaakulan agen yang relevan dengan pertanyaan, bukan keseluruhan modelnya.

3.2. Rantaian Penaakulan (Chain of Thought) untuk Renungan Kendiri

Proses CoT mengubah serpihan TMK yang diambil menjadi jejak penaakulan berstruktur. Untuk tugas $T_1$, kaedah $M_1$, dan item pengetahuan $K_1, K_2$ yang diambil, prompt CoT mungkin direkayasa sebagai:

"Matlamat agen (Tugas) adalah: [Penerangan T_1].
Untuk mencapainya, ia menggunakan kaedah: [Penerangan M_1].
Kaedah ini memerlukan pengetahuan: [Penerangan K_1] dan [Penerangan K_2].
Oleh itu, keputusan agen adalah berdasarkan..."

Jejak berstruktur ini kemudiannya dimasukkan kepada ChatGPT dengan arahan seperti: "Berdasarkan langkah penaakulan berstruktur berikut, jana penjelasan yang jelas dan ringkas untuk seorang pelajar."

4. Penilaian Eksperimen & Keputusan

4.1. Metrik Penilaian: Kelengkapan & Ketepatan

Penulis menilai penjelasan kendiri sepanjang dua dimensi utama:

Kelengkapan: Adakah penjelasan meliputi semua langkah relevan dalam proses keputusan agen seperti yang ditakrifkan oleh model TMK? Ini dinilai dengan memetakan kandungan penjelasan kembali kepada elemen TMK.
Ketepatan: Adakah penjelasan mencerminkan dengan tepat proses sebenar agen, tanpa memperkenalkan halusinasi atau percanggahan? Ini memerlukan pengesahan pakar terhadap kod/log agen.

Pandangan Penilaian Utama

Pendekatan hibrid menunjukkan skor tinggi dalam ketepatan kerana model penjana dikawal rapat oleh data TMK yang diambil. Kelengkapan lebih berubah-ubah, bergantung pada kualiti carian keserupaan dan kejuruteraan prompt untuk CoT.

4.2. Keputusan daripada Penempatan Kelas Langsung

Sistem ini ditempatkan dalam kelas dalam talian langsung. Walaupun keputusan kuantitatif khusus tidak diperincikan dalam petikan yang diberikan, kertas kerja melaporkan tentang penempatan ini, mencadangkan tumpuan kepada pengesahan dunia sebenar kualitatif atau awal. Penempatan itu sendiri adalah keputusan yang signifikan, menunjukkan kebolehgunaan praktikal pendekatan dalam persekitaran pendidikan yang dinamik. Kerja masa depan akan mendapat manfaat daripada ujian A/B yang mengukur metrik kepercayaan (contohnya, tinjauan pengguna tentang ketelusan yang dirasakan, kebolehpercayaan) antara kumpulan yang menerima penjelasan dan mereka yang tidak.

Penerangan Carta Hipotesis: Carta bar membandingkan skor "Kualiti Penjelasan" (Kelengkapan dan Ketepatan pada skala 1-5) untuk kaedah Hibrid TMK+ChatGPT berbanding garis dasar menggunakan ChatGPT sahaja dengan hanya pertanyaan pengguna. Kaedah hibrid akan menunjukkan bar yang jauh lebih tinggi untuk Ketepatan, menunjukkan kesan pembumian model kendiri.

5. Rangka Kerja Analisis & Contoh Kes

Senario: SAMI menghubungkan Pelajar Bob (berminat dalam "Muzik Jazz" dan "Pengaturcaraan Python") dengan Pelajar Alice (berminat dalam "Muzik Blues" dan "Sains Data").

Pertanyaan Pengguna: "Mengapa saya dihubungkan dengan Alice?"

Serpihan Model Kendiri TMK Dalaman (Diambil):

T1: "Pupuk hubungan sosial berdasarkan keserupaan profil."
M1: "Kira pertindihan minat menggunakan keserupaan Jaccard pada tag minat."
K1 (Bob): "Minat: Muzik Jazz, Pengaturcaraan Python."
K2 (Alice): "Minat: Muzik Blues, Sains Data."
K3 (Pengiraan): "Tag dikongsi: 'Muzik' (daripada Jazz/Blues) dan 'Pengaturcaraan' (daripada Python/Sains Data). Skor keserupaan: 0.4."

Prompt Rantaian Penaakulan untuk ChatGPT:
"Tugas agen adalah untuk memupuk hubungan berdasarkan keserupaan profil. Kaedahnya adalah untuk mengira pertindihan minat. Untuk anda (Bob), ia tahu minat anda: Muzik Jazz, Pengaturcaraan Python. Untuk Alice, ia tahu minatnya: Muzik Blues, Sains Data. Ia mengira skor keserupaan berdasarkan kategori bertindih (Muzik, Pengaturcaraan). Skor adalah 0.4, yang memenuhi ambangnya untuk mencadangkan sambungan. Oleh itu..."

Penjelasan Akhir Terjana:
"Saya menghubungkan anda dengan Alice kerana sistem kami mengenal pasti minat bersama yang boleh menjadi asas yang baik untuk perbualan. Anda berdua mempunyai minat dalam muzik (Jazz/Blues) dan topik teknikal berkaitan pengaturcaraan (Python/Sains Data). Berdasarkan pertindihan ini, saya fikir anda mungkin mempunyai persamaan untuk memulakan perbincangan."

6. Analisis Kritikal & Pandangan Pakar

Pandangan Teras: Kertas kerja ini bukan sekadar tentang menjadikan AI boleh dijelaskan; ia adalah cetak biru strategik untuk kejuruteraan kepercayaan dalam agen yang tertanam secara sosial. Penulis mengenal pasti dengan betul bahawa dalam domain seperti pendidikan, pengaruh agen bukan datang daripada prestasi tugas mental tetapi daripada peranannya sebagai pelaku sosial yang kredibel. Pendekatan hibrid mereka—menggunakan model kendiri simbolik sebagai "sumber kebenaran" untuk mengatasi kecenderungan AI penjana untuk berkhayal—adalah hack pragmatik dan perlu dalam era LLM semasa. Ia secara langsung menangani apa yang diperdebatkan oleh penyelidik seperti Cynthia Rudin: kita memerlukan model yang secara semula jadi boleh ditafsir, bukan penjelasan pasca fakta. Di sini, model TMK menyediakan struktur semula jadi itu.

Aliran Logik & Sumbangan: Logiknya menarik: 1) Agen sosial memerlukan kepercayaan, 2) Kepercayaan memerlukan ketelusan, 3) Ketelusan memerlukan penjelasan kendiri, 4) Penjelasan kendiri yang boleh dipercayai memerlukan model kendiri yang dibumikan, 5) Penjelasan yang boleh digunakan memerlukan bahasa semula jadi, 6) Oleh itu, gabungkan model yang dibumikan (TMK) dengan penjana bahasa (LLM). Sumbangan utama ialah seni bina khusus yang mengoperasionalkan aliran ini, terutamanya penggunaan carian keserupaan ke atas penerangan TMK yang dinaturalisasikan sebagai mekanisme pengambilan. Ini lebih elegan daripada pencetus peraturan yang dikod keras.

Kekuatan & Kelemahan: Kekuatan utamanya ialah reka bentuk hibrid praktikalnya, mengelakkan ketidakjelasan pembelajaran mendalam tulen dan kerapuhan sistem simbolik tulen. Ia adalah aplikasi bijak prinsip penjanaan dipertingkatkan pengambilan (RAG), tetapi digunakan pada pengetahuan kendiri dan bukannya dokumen luaran—konsep yang mempunyai potensi. Walau bagaimanapun, kelemahannya adalah ketara. Pertama, model kendiri adalah statik dan dikraf tangan. Ia tidak belajar atau dikemas kini daripada interaksi, mewujudkan beban penyelenggaraan dan risiko hanyut daripada kod agen sebenar. Kedua, penilaiannya nipis. Di mana nombor keras tentang kepercayaan pengguna, kefahaman, atau perubahan tingkah laku? Tanpa ini, ia adalah bukti konsep kejuruteraan, bukan alat pembina kepercayaan yang disahkan. Ketiga, ia mengandaikan model TMK adalah perwakilan sempurna penaakulan "benar" agen, yang mungkin tidak berlaku untuk agen kompleks dan adaptif.

Pandangan Boleh Tindak: Untuk pengamal, pengambilannya jelas: Mulakan mereka bentuk sistem AI anda dengan model kendiri yang boleh dipertanyakan dari hari pertama. Kertas kerja ini menyediakan templat yang boleh dilaksanakan. Langkah seterusnya adalah mengautomasikan penciptaan dan pengemaskinian model kendiri ini, mungkin menggunakan teknik daripada AI neuro-simbolik atau kebolehtafsiran mekanistik. Untuk penyelidik, cabarannya adalah untuk bergerak melampaui model kendiri statik kepada perwakilan kendiri dinamik yang boleh dipelajari. Bolehkah agen mempelajari struktur TMKnya sendiri daripada pengalaman dan kodnya? Tambahan pula, bidang ini mesti membangunkan penanda aras piawai untuk menilai impak sosio-kognitif penjelasan, bukan hanya kelengkapan teknikalnya. Adakah penjelasan seperti yang dijana sebenarnya meningkatkan kesediaan pelajar untuk melibatkan diri dengan rakan yang dicadangkan oleh AI? Itulah metrik muktamad yang penting.

7. Aplikasi Masa Depan & Hala Tuju Penyelidikan

Pembelajaran Model Kendiri Automatik: Mengintegrasikan teknik daripada sintesis program atau analisis kod berasaskan LLM untuk menjana dan mengemas kini model kendiri TMK secara automatik daripada kod sumber dan log masa jalan agen, mengurangkan kejuruteraan manual.
Sistem Multi-Agen Boleh Dijelaskan: Memperluas rangka kerja untuk menjelaskan tingkah laku kolektif atau kawanan agen, di mana penjelasan mungkin melibatkan protokol penyelarasan dan tingkah laku muncul.
Gaya Penjelasan Peribadi: Menyesuaikan komponen penjana untuk menyesuaikan kerumitan penjelasan, nada, dan fokus berdasarkan profil pengguna individu (contohnya, pemula vs. pakar, skeptikal vs. mempercayai).
Penjelasan Proaktif & Kontrastif: Bergerak melampaui QA reaktif kepada agen yang secara proaktif menawarkan penjelasan untuk tindakan tidak dijangka atau memberikan penjelasan kontrastif ("Saya menghubungkan anda dengan Alice dan bukannya Charlie kerana...").
Aplikasi dalam Domain Berisiko Tinggi: Menempatkan seni bina penjelasan kendiri yang serupa dalam AI penjagaan kesihatan (menjelaskan cadangan rawatan), fintech (menjelaskan penolakan pinjaman), atau sistem autonomi (menjelaskan keputusan navigasi), di mana ketelusan diwajibkan secara sah atau etika.
Penyelidikan Penentukuran Kepercayaan: Kajian longitudinal untuk mengukur bagaimana pendedahan kepada penjelasan sedemikian dari masa ke masa mempengaruhi kepercayaan pengguna, pergantungan, dan keberkesanan sistem keseluruhan dalam mencapai matlamat sosialnya.

8. Rujukan

Goel, A. K., & Joyner, D. A. (2017). Using AI to teach AI: Lessons from an online AI class. AI Magazine.
Rudin, C. (2019). Stop explaining black box machine learning models for high stakes decisions and use interpretable models instead. Nature Machine Intelligence.
Wei, J., et al. (2022). Chain-of-Thought Prompting Elicits Reasoning in Large Language Models. Advances in Neural Information Processing Systems.
Muller, M., et al. (2019). Principles for Explainable AI. Communications of the ACM.
Confalonieri, R., et al. (2021). A historical perspective of explainable AI. WIREs Data Mining and Knowledge Discovery.
Goodfellow, I., et al. (2014). Generative Adversarial Nets. Advances in Neural Information Processing Systems. (Sebagai contoh teknik AI asas, namun sering tidak jelas, yang memerlukan kaedah penjelasan pasca fakta).
Georgia Institute of Technology, Interactive Computing - Design & Intelligence Lab. (https://dilab.gatech.edu/) – Untuk konteks persekitaran penyelidikan yang menghasilkan kerja ini.
OpenAI. (2023). ChatGPT. (https://openai.com/chatgpt) – Komponen AI penjana yang dirujuk dalam kertas kerja.