人工科學家：邏輯主義、湧現主義與通用主義的AGI途徑

1. 引言

本文探討了創建「人工科學家」這一雄心勃勃的目標，即一種能夠獨立進行諾貝爾獎級別研究的AI，正如Goertzel於2014年的綜述中所提出的。它闡明了此類實體所需具備的必要能力，並將此目標置於更廣泛的人工通用智慧（AGI）研究領域中。核心問題不僅在於自動化科學任務，更在於賦予AI科學家的核心認知美德：懷疑精神、實證驗證與理論建構。

2. 人工科學家需要具備什麼？

從英國皇家學會的格言「nullius in verba」（勿信人言）汲取靈感，作者提煉出人工科學家必須具備的核心能力。

2.1 假設的表徵

智慧體必須具備一種形式化或符號化的方法，將任何可測試的假設表徵為具有真值的陳述。這是任何形式科學推理的基礎要求。

2.2 歸納推理

拒絕將他人證言作為知識基礎，這就需要具備從特定觀察中推導出普遍原理的能力。這是從經驗數據中學習的核心。

2.3 演繹與溯因推理

智慧體必須透過嚴謹的演繹推理（從普遍規則到特定結論）來轉化知識。關鍵在於，它還必須能夠進行溯因推理——生成能夠解釋觀察現象的合理假設，這些假設隨後成為實驗測試的候選方案。

2.4 因果推理與可解釋性

科學追求因果關係。人工科學家必須能夠進行因果推理，以設計有意義的實驗。此外，它必須能夠以人類受眾可以理解的方式解釋其假設和發現，這表明需要超越單純的模型可解釋性，邁向先進的自然語言生成。

2.5 假設的評估

在資源有限的情況下，智慧體需要啟發式方法來判斷應追蹤哪些假設。這涉及評估合理性（為真的可能性）和潛在收益（所獲知識的重要性或效用）。這引入了一個固有的規範性成分（「應該」），必須提供給AI。

3. 適用於人工科學家的AGI途徑

本文根據上述要求評估了三種主要的AGI範式。

3.1 邏輯主義途徑

此範式植根於符號AI，使用形式邏輯進行知識表徵和推理。優勢：非常適合演繹和溯因推理、假設表徵，並能產生明確、可解釋的模型。缺陷：難以從原始數據中學習（歸納）、可擴展性差，且難以處理不確定性或感知任務。

3.2 湧現主義途徑

此範式以深度學習等聯結主義模型為代表，旨在讓智慧從簡單元件的互動中湧現。優勢：擅長從大數據集中進行歸納推理、模式識別和感知任務。缺陷：在顯式推理、溯因、因果建模方面較弱，且通常是「黑箱」，缺乏可解釋性。

3.3 通用主義途徑

此範式尋求一個單一的、數學上通用的智慧框架，通常基於演算法資訊理論或Solomonoff歸納法。優勢：理論上優雅且通用。缺陷：計算上難以處理，使得實際應用目前不可行。

4. 邁向統一框架

本文的結論是，沒有一種現有範式能完全滿足人工科學家的所有要求。因此，混合或統一的途徑是必要的。它簡要探討了結合多種元素的理論，例如神經符號AI，它將神經網路的強大學習能力與符號系統的結構化推理相結合，作為滿足科學發現多方面需求的一個有前景的方向。

5. 核心洞見與分析師觀點

核心洞見：「人工科學家」不僅僅是一個自動化工具，更是對AGI的終極壓力測試。它要求融合多種能力——數據驅動的學習、邏輯嚴謹性、因果理解以及清晰的溝通能力——而當今各自為政的AI技術單獨來看都明顯無法提供。本文正確地指出，模式匹配（湧現主義）與規則遵循（邏輯主義）AI之間的鴻溝是主要障礙。

邏輯脈絡：論證過程優雅而簡潔：定義科學家的核心認知行為，將其映射到認知能力，然後根據這份清單嚴格審核現有的AGI範式。每種範式在關鍵點上的失敗，邏輯上必然導向整合的結論。在假設評估方面提及休謨的剃刀，是一個犀利的哲學觸筆，突顯了任何自主科學家都無法避免地需要內建的價值觀或啟發式方法。

優點與缺陷：本文的優點在於其清晰、以需求為導向地解構了一個宏大挑戰。它避免了模糊的承諾，專注於具體的能力缺口。然而，其主要缺陷在於對所提解決方案的處理過於輕描淡寫。提及「混合途徑」是AI領域的老生常談。真正的洞見應是提出一個具體的架構藍圖或一個最小可行的整合方案，類似於CycleGAN論文為非配對圖像轉換提供了一個具體框架。若無此，結論感覺像是必要但不足夠的一步。

可行洞見：對於研究人員而言，直接的啟示是不要再將神經符號AI視為小眾興趣。它應成為「AI for Science」的核心研究議程。像DARPA的ASDF計劃這樣的資助機構，應優先考慮那些明確將神經感知與符號推理引擎耦合的架構。對於產業界，重點應放在開發可與大型語言模型整合的「因果發現工具包」，超越相關性，邁向可操作的假設生成。通往人工科學家的道路始於建構不僅能閱讀十萬篇論文，還能識別出它們共同存在的一個錯誤假設的AI——這項任務需要作者所設想的混合心智。

6. 技術細節與數學框架

這些要求意味著一個形式化框架。假設評估可以構建為一個最佳化問題，平衡合理性和效用。給定數據 $D$ 和效用函數 $U$，從空間 $H$ 中選擇假設 $h$ 的一個簡化形式化可以是：

$$h^* = \arg\max_{h \in H} \left[ \alpha \cdot \log P(h|D) + \beta \cdot U(h) \right]$$

其中：

$P(h|D)$ 是給定數據下假設的後驗合理性（需要貝葉斯推論或近似方法）。
$U(h)$ 是一個效用函數，估計研究 $h$ 的「收益」（例如，取得突破性發現的潛力、實際應用價值）。
$\alpha$ 和 $\beta$ 是平衡兩個目標的參數，代表智慧體內在的「價值觀」。

溯因可以被視為從 $H$ 中生成具有不可忽略 $P(h|D)$ 的候選 $h$ 的過程。通用主義途徑可能使用演算法機率來定義 $P(h|D)$，而湧現主義途徑會從數據中學習它，邏輯主義途徑則可能從知識庫中推導它。

7. 分析框架：個案研究

情境：一個AI分析公共衛生數據，觀察到A地區與疾病X較高發生率之間的相關性。

純湧現主義（深度學習）模型：以高準確度識別出該模式。當被問及「為什麼？」時，它只能突出相關特徵（例如，A地區的空氣品質指數是主要預測因子）。它無法提出一個可測試的機制性假設，例如「A地區普遍存在的污染物Y，抑制了細胞過程Z，導致了疾病X。」

純邏輯主義（符號）模型：擁有一個生物學知識庫。它可以推理出「抑制過程Z可能導致疾病X」以及「污染物Y是Z的抑制劑」。然而，它可能缺乏從原始、混亂的數據集中發現A地區與疾病之間新穎統計關聯的能力。

混合神經符號途徑：

感知/歸納（神經網路）：從數據中發現A地區與疾病X之間的相關性。
符號接地：將「A地區」映射到其知識庫中的已知事實：「A地區污染物Y含量高。」
溯因（符號推理器）：查詢其生物學知識圖譜：「疾病X的已知原因是什麼？污染物Y能與任何這些原因聯繫起來嗎？」它找到了與細胞過程Z的連結。
假設形成：生成可測試的因果假設：「污染物Y通過抑制過程Z導致疾病X。」
實驗設計：使用因果推理，提出一個體外實驗，將細胞暴露於污染物Y並測量過程Z的活性。

這個案例說明了混合模型如何實現完整的人工科學家工作流程，而單一範式則在此失敗。

8. 未來應用與方向

近期（5-10年）：開發「AI研究助理」，大幅加速材料科學（發現新催化劑）和藥物發現（識別新藥物靶點途徑）等領域的文獻綜述、假設生成和實驗設計。這些將是範圍嚴格限定的混合系統。

中期（10-20年）：在數據豐富、理論薄弱的領域中運作的自主發現系統。例如，分析來自JWST等望遠鏡的天文數據集以提出新的天體物理模型，或篩選基因組和蛋白質組數據以發現超越人類模式識別能力的複雜疾病病因。

長期與推測性：真正的人工科學家，能夠在基礎物理學（例如，提出並測試量子重力理論）或數學（生成並證明深刻的猜想）中做出典範轉移的發現。這不僅需要AI架構的進步，還需要自動化物理實驗（機器人實驗室）的進步，或許還需要面向機器的新型數學形式。最終方向是朝向能夠重新定義科學方法本身的AI，探索人類心智無法理解的推論策略。

9. 參考文獻

Goertzel, B. (2014). Artificial General Intelligence: Concept, State of the Art, and Future Prospects. Journal of Artificial General Intelligence, 5(1), 1-48.
Bringsjord, S., & Licato, J. (2012). Psychometric Artificial General Intelligence: The Piaget-MacGuyver Room. In Theoretical Foundations of Artificial General Intelligence (pp. 25-48). Atlantis Press.
Pearl, J. (2009). Causality: Models, Reasoning, and Inference (2nd ed.). Cambridge University Press.
Marcus, G. (2020). The Next Decade in AI: Four Steps Towards Robust Artificial Intelligence. arXiv preprint arXiv:2002.06177.
Garcez, A. d., & Lamb, L. C. (2020). Neurosymbolic AI: The 3rd Wave. arXiv preprint arXiv:2012.05876.
King, R. D., et al. (2009). The Automation of Science. Science, 324(5923), 85-89.
Hutter, M. (2005). Universal Artificial Intelligence: Sequential Decisions Based on Algorithmic Probability. Springer.
DARPA. Automated Scientific Discovery Framework (ASDF) Program. Retrieved from https://www.darpa.mil.