1. مقدمه
این مقاله به هدف بلندپروازانه ایجاد یک "دانشمند مصنوعی" میپردازد؛ یک هوش مصنوعی که قادر به انجام تحقیقات شایسته جایزه نوبل به طور مستقل باشد، همانطور که در بررسی گورتزل در سال ۲۰۱۴ پیشنهاد شده است. این مقاله قابلیتهای ضروری برای چنین موجودی را روشن میکند و این هدف را در چشمانداز گستردهتر تحقیقات هوش مصنوعی عمومی جای میدهد. سوال محوری صرفاً خودکارسازی وظایف علمی نیست، بلکه مجهز کردن یک هوش مصنوعی به فضایل معرفتی اصلی یک دانشمند است: شکگرایی، اعتبارسنجی تجربی و نظریهپردازی.
2. از یک دانشمند مصنوعی چه انتظاری میرود؟
با الهام از شعار انجمن سلطنتی "nullius in verba" (حرف هیچکس را قبول نکن)، نویسندگان قابلیتهای اساسی که یک دانشمند مصنوعی باید دارا باشد را استخراج میکنند.
2.1 بازنمایی فرضیهها
عامل باید ابزاری صوری یا نمادین برای بازنمایی هر فرضیه قابل آزمون به عنوان گزارهای با ارزش صدق داشته باشد. این یک نیاز بنیادین برای هر شکل از استدلال علمی است.
2.2 استنتاج استقرایی
رد شهادت به عنوان مبنایی برای دانش، مستلزم توانایی استنتاج اصول کلی از مشاهدات خاص است. این هسته اصلی یادگیری از دادههای تجربی است.
2.3 استدلال قیاسی و تبیینی
عامل باید دانش را از طریق استدلال قیاسی معتبر (از قواعد کلی به نتایج خاص) تغییر دهد. به طور حیاتی، باید استدلال تبیینی نیز انجام دهد - یعنی تولید فرضیههای محتملی که بتوانند پدیدههای مشاهده شده را توضیح دهند، که سپس به عنوان کاندیدایی برای آزمون تجربی درمیآیند.
2.4 استدلال علّی و قابلیت تبیین
علم به دنبال روابط علت و معلولی است. دانشمند مصنوعی باید بتواند به صورت علّی استدلال کند تا آزمایشهای معناداری طراحی کند. علاوه بر این، باید بتواند فرضیهها و یافتههای خود را به گونهای قابل فهم برای مخاطب انسانی توضیح دهد، که نشاندهنده نیاز به تولید پیشرفته زبان طبیعی است، فراتر از صرف تفسیرپذیری مدل.
2.5 ارزیابی فرضیهها
با توجه به منابع محدود، عامل به اکتشافاتی نیاز دارد تا قضاوت کند کدام فرضیهها را دنبال کند. این شامل ارزیابی هم محتمل بودن (احتمال درست بودن) و هم سود بالقوه (اهمیت یا فایده دانش کسب شده) است. این یک جزء هنجاری ذاتی ("باید") را معرفی میکند که باید به هوش مصنوعی داده شود.
3. رویکردهای هوش مصنوعی عمومی برای یک دانشمند مصنوعی
این مقاله سه پارادایم اصلی هوش مصنوعی عمومی را در برابر الزامات فوق ارزیابی میکند.
3.1 رویکرد منطقگرا
این پارادایم، ریشه در هوش مصنوعی نمادین دارد و از منطق صوری برای بازنمایی دانش و استدلال استفاده میکند. نقاط قوت: عالی برای استدلال قیاسی و تبیینی، بازنمایی فرضیه و تولید مدلهای صریح و قابل تبیین. نقاط ضعف: در یادگیری از دادههای خام (استقرا)، مقیاسپذیری و مدیریت عدم قطعیت یا وظایف ادراکی مشکل دارد.
3.2 رویکرد ظهورگرا
این پارادایم، که با مدلهای ارتباطگرا مانند یادگیری عمیق نمونهسازی شده است، هدفش ظهور هوش از تعامل اجزای ساده است. نقاط قوت: قدرتمند در استنتاج استقرایی از مجموعه دادههای بزرگ، تشخیص الگو و وظایف ادراکی. نقاط ضعف: ضعیف در استدلال صریح، تبیین، مدلسازی علّی و اغلب یک "جعبه سیاه" است که فاقد قابلیت تبیین است.
3.3 رویکرد جهانشمول
این پارادایم به دنبال یک چارچوب ریاضی واحد و کلی برای هوش است، که اغلب بر اساس نظریه اطلاعات الگوریتمی یا استقرای سولومونوف است. نقاط قوت: از نظر تئوری ظریف و جهانشمول. نقاط ضعف: از نظر محاسباتی غیرعملی، که اجرای عملی آن را در حال حاضر غیرممکن میسازد.
4. به سوی یک چارچوب یکپارچه
مقاله نتیجه میگیرد که هیچ پارادایم موجود واحدی تمام الزامات یک دانشمند مصنوعی را برآورده نمیکند. یک رویکرد ترکیبی یا یکپارچه ضروری است. این مقاله به طور خلاصه نظریههایی را بررسی میکند که عناصر مختلف را ترکیب میکنند، مانند هوش مصنوعی عصبنمادین، که یادگیری قوی شبکههای عصبی را با استدلال ساختاریافته سیستمهای نمادین ادغام میکند، به عنوان یک جهت امیدوارکننده برای برآوردن خواستههای چندوجهی کشف علمی.
5. بینش کلیدی و دیدگاه تحلیلی
بینش کلیدی: "دانشمند مصنوعی" صرفاً یک ابزار خودکارسازی نیست، بلکه آزمون استرس نهایی برای هوش مصنوعی عمومی است. این امر نیازمند تلفیقی از قابلیتهاست - یادگیری مبتنی بر داده، دقت منطقی، درک علّی و وضوح ارتباطی - که انبارهای امروزی هوش مصنوعی به طور چشمگیری در ارائه جداگانه آن شکست میخورند. مقاله به درستی شناسایی میکند که شکاف بین هوش مصنوعی تطبیق الگو (ظهورگرا) و پیروی از قاعده (منطقگرا) مانع اصلی است.
جریان منطقی: استدلال به زیبایی ساده است: کنشهای معرفتی اصلی دانشمند را تعریف کن، آنها را به قابلیتهای شناختی نگاشت بده و سپس پارادایمهای موجود هوش مصنوعی عمومی را در برابر این چکلیست بیرحمانه حسابرسی کن. شکست هر پارادایم در نقاط کلیدی، منطقاً نتیجهگیری را به سمت یکپارچهسازی سوق میدهد. ارجاع به گیوتین هیوم در مورد ارزیابی فرضیه، لمس فلسفی تیزبینانهای است که نیاز اجتنابناپذیر به ارزشها یا اکتشافات درونی در هر دانشمند خودمختار را برجسته میکند.
نقاط قوت و ضعف: نقطه قوت مقاله، ساختارشکنی واضح و مبتنی بر الزامات از یک چالش بزرگ است. از وعدههای مبهم اجتناب میکند و بر شکافهای قابلیتی متمرکز است. با این حال، نقطه ضعف اصلی آن، برخورد سبک با راهحل پیشنهادی است. اشاره به "رویکردهای ترکیبی" یک کلیشه فرسوده در هوش مصنوعی است. بینش واقعی، پیشنهاد یک طرح معماری خاص یا یک ادغام حداقلی قابل اجرا خواهد بود، مشابه نحوهای که مقاله CycleGAN یک چارچوب مشخص برای ترجمه تصویر به تصویر جفتنشده ارائه داد. بدون این، نتیجهگیری مانند گامی ضروری اما ناکافی به نظر میرسد.
بینشهای عملی: برای محققان، برداشت فوری این است که دیگر هوش مصنوعی عصبنمادین را به عنوان یک علاقه حاشیهای نبینند. این باید دستور کار اصلی تحقیقات برای هوش مصنوعی-برای-علم باشد. نهادهای تأمینکننده بودجه مانند برنامه ASDF دارپا باید معماریهایی را در اولویت قرار دهند که به صراحت ادراک عصبی را با موتورهای استدلال نمادین جفت میکنند. برای صنعت، تمرکز باید بر توسعه "جعبه ابزار کشف علّی" باشد که بتواند با مدلهای زبانی بزرگ یکپارچه شود، فراتر از همبستگی به سمت تولید فرضیه عملی حرکت کند. مسیر به سوی یک دانشمند مصنوعی با ساختن هوشهای مصنوعی آغاز میشود که نه تنها میتوانند ۱۰۰۰۰۰ مقاله را بخوانند، بلکه میتوانند آن یک فرض نادرستی را که همه آنها به اشتراک دارند شناسایی کنند - وظیفهای که نیازمند ذهن ترکیبی است که نویسندگان تصور میکنند.
6. جزئیات فنی و چارچوب ریاضی
الزامات دلالت بر یک چارچوب صوری دارند. ارزیابی فرضیه را میتوان به عنوان یک مسئله بهینهسازی قالببندی کرد که محتمل بودن و فایده را متعادل میسازد. یک صوریسازی ساده شده برای انتخاب یک فرضیه $h$ از فضای $H$ با توجه به داده $D$ و تابع مطلوبیت $U$ میتواند به این شکل باشد:
$$h^* = \arg\max_{h \in H} \left[ \alpha \cdot \log P(h|D) + \beta \cdot U(h) \right]$$
جایی که:
- $P(h|D)$ محتمل بودن پسین فرضیه با توجه به داده است (نیازمند استنتاج بیزی یا تقریبها).
- $U(h)$ یک تابع مطلوبیت است که "سود" بررسی $h$ را تخمین میزند (مثلاً، پتانسیل برای کشف انقلابی، کاربرد عملی).
- $\alpha$ و $\beta$ پارامترهایی هستند که دو هدف را متعادل میکنند و نمایانگر "ارزشهای" ذاتی عامل هستند.
تبیین را میتوان فرآیند تولید کاندیدای $h$ از $H$ دید که $P(h|D)$ غیرقابل اغماضی دارند. رویکردهای جهانشمول ممکن است $P(h|D)$ را با استفاده از احتمال الگوریتمی تعریف کنند، در حالی که رویکردهای ظهورگرا آن را از داده میآموزند، و رویکردهای منطقگرا ممکن است آن را از یک پایگاه دانش استخراج کنند.
7. چارچوب تحلیل: یک مطالعه موردی
سناریو: یک هوش مصنوعی دادههای سلامت عمومی را تحلیل میکند و همبستگی بین منطقه A و بروز بالاتر بیماری X را مشاهده میکند.
مدل ظهورگرای محض (یادگیری عمیق): الگو را با دقت بالا شناسایی میکند. وقتی پرسیده میشود "چرا؟"، فقط میتواند ویژگیهای مؤثر را برجسته کند (مثلاً، شاخص کیفیت هوا در منطقه A یک پیشبین برتر است). نمیتواند یک فرضیه مکانیکی قابل آزمون مانند "آلاینده Y، که در منطقه A شایع است، فرآیند سلولی Z را مهار میکند و منجر به بیماری X میشود" را پیشنهاد دهد.
مدل منطقگرای محض (نمادین): یک پایگاه دانش از زیستشناسی دارد. میتواند استدلال کند که "مهار فرآیند Z میتواند باعث بیماری X شود" و اینکه "آلاینده Y یک مهارکننده Z است." با این حال، ممکن است فاقد توانایی کشف ارتباط آماری جدید بین منطقه A و بیماری از مجموعه دادههای خام و آشفته باشد.
رویکرد ترکیبی عصبنمادین:
- ادراک/استقرا (شبکه عصبی): همبستگی بین منطقه A و بیماری X را از داده کشف میکند.
- زمینهسازی نمادین: "منطقه A" را به حقایق شناخته شده در پایگاه دانشش نگاشت میدهد: "منطقه A سطوح بالایی از آلاینده Y دارد."
- تبیین (استدلالگر نمادین): از گراف دانش زیستشناسی خود پرس و جو میکند: "علل شناخته شده بیماری X چیست؟ آیا آلاینده Y میتواند به هر یک از این علل مرتبط شود؟" پیوند را با فرآیند سلولی Z پیدا میکند.
- تشکیل فرضیه: فرضیه علّی قابل آزمون را تولید میکند: "آلاینده Y با مهار فرآیند Z باعث بیماری X میشود."
- طراحی آزمایش: از استدلال علّی استفاده میکند تا یک آزمایش درون شیشهای پیشنهاد دهد که سلولها را در معرض آلاینده Y قرار میدهد و فعالیت فرآیند Z را اندازهگیری میکند.
8. کاربردها و جهتگیریهای آینده
کوتاهمدت (۱۰-۵ سال): توسعه "دستیاران تحقیقاتی هوش مصنوعی" که به شدت مرور ادبیات، تولید فرضیه و طراحی آزمایش را در حوزههایی مانند علم مواد (کشف کاتالیزورهای جدید) و کشف دارو (شناسایی مسیرهای جدید هدف دارویی) تسریع میکنند. اینها سیستمهای ترکیبی با دامنه محدود خواهند بود.
میانمدت (۲۰-۱۰ سال): سیستمهای کشف خودمختار که در حوزههای غنی از داده و فقیر از نظریه عمل میکنند. مثالها شامل تحلیل مجموعه دادههای نجومی از تلسکوپهایی مانند جیمز وب برای پیشنهاد مدلهای جدید اخترفیزیکی، یا غربالگری دادههای ژنومیک و پروتئومیک برای کشف علل بیماریهای پیچیده فراتر از تشخیص الگوی انسانی است.
بلندمدت و فرضی: دانشمندان مصنوعی واقعی قادر به اکتشافات تغییردهنده پارادایم در فیزیک بنیادی (مثلاً، پیشنهاد و آزمون نظریههای گرانش کوانتومی) یا ریاضیات (تولید و اثبات حدسهای عمیق). این نه تنها نیازمند پیشرفت در معماری هوش مصنوعی، بلکه در آزمایش فیزیکی خودکار (آزمایشگاههای رباتیک) و شاید اشکال جدیدی از ریاضیات ماشینمحور است. جهتگیری نهایی به سوی هوش مصنوعی است که میتواند روش علمی را بازتعریف کند، و استراتژیهای استنتاجی را کاوش کند که برای ذهن انسان غیرقابل درک است.
9. منابع
- Goertzel, B. (2014). Artificial General Intelligence: Concept, State of the Art, and Future Prospects. Journal of Artificial General Intelligence, 5(1), 1-48.
- Bringsjord, S., & Licato, J. (2012). Psychometric Artificial General Intelligence: The Piaget-MacGuyver Room. In Theoretical Foundations of Artificial General Intelligence (pp. 25-48). Atlantis Press.
- Pearl, J. (2009). Causality: Models, Reasoning, and Inference (2nd ed.). Cambridge University Press.
- Marcus, G. (2020). The Next Decade in AI: Four Steps Towards Robust Artificial Intelligence. arXiv preprint arXiv:2002.06177.
- Garcez, A. d., & Lamb, L. C. (2020). Neurosymbolic AI: The 3rd Wave. arXiv preprint arXiv:2012.05876.
- King, R. D., et al. (2009). The Automation of Science. Science, 324(5923), 85-89.
- Hutter, M. (2005). Universal Artificial Intelligence: Sequential Decisions Based on Algorithmic Probability. Springer.
- DARPA. Automated Scientific Discovery Framework (ASDF) Program. Retrieved from https://www.darpa.mil.