Искусственный учёный: логицистский, эмерджентистский и универсалистский подходы к ИИО

1. Введение

В статье рассматривается амбициозная цель создания «Искусственного учёного» — ИИ, способного самостоятельно проводить исследования нобелевского уровня, как это было предложено в обзоре Гертцеля 2014 года. В ней уточняются необходимые способности для такого субъекта и помещается эта цель в более широкий контекст исследований в области Искусственного общего интеллекта (ИИО). Ключевой вопрос заключается не просто в автоматизации научных задач, а в наделении ИИ основными эпистемическими добродетелями учёного: скептицизмом, эмпирической проверкой и формированием теорий.

2. Что требуется от Искусственного учёного?

Вдохновляясь девизом Королевского общества «nullius in verba» (не верь словам), авторы выделяют основные способности, которыми должен обладать Искусственный учёный.

2.1 Представление гипотез

Агент должен иметь формальное или символическое средство для представления любой проверяемой гипотезы в виде утверждения с истинностным значением. Это фундаментальное требование для любой формы научного рассуждения.

2.2 Индуктивный вывод

Отказ от свидетельств как основы для знания требует способности выводить общие принципы из конкретных наблюдений. Это основа обучения на эмпирических данных.

2.3 Дедуктивное и абдуктивное рассуждение

Агент должен преобразовывать знания с помощью корректного дедуктивного рассуждения (от общих правил к конкретным выводам). Критически важно, чтобы он также выполнял абдуктивное рассуждение — генерировал правдоподобные гипотезы, которые могли бы объяснить наблюдаемые явления, которые затем становятся кандидатами для экспериментальной проверки.

2.4 Каузальное рассуждение и объяснимость

Наука ищет причинно-следственные связи. Искусственный учёный должен уметь рассуждать каузально, чтобы проектировать осмысленные эксперименты. Более того, он должен уметь объяснять свои гипотезы и выводы понятным для своей человеческой аудитории образом, что предполагает необходимость продвинутой генерации естественного языка, выходящей за рамки простой интерпретируемости модели.

2.5 Оценка гипотез

Имея ограниченные ресурсы, агенту нужны эвристики, чтобы судить, какие гипотезы стоит исследовать. Это включает оценку как правдоподобия (вероятности истинности), так и потенциальной выгоды (значимости или полезности получаемого знания). Это вводит неизбежный нормативный компонент («должно»), который должен быть заложен в ИИ.

3. Подходы к ИИО для Искусственного учёного

В статье оцениваются три основные парадигмы ИИО с точки зрения вышеуказанных требований.

3.1 Логицистский подход

Эта парадигма, уходящая корнями в символьный ИИ, использует формальную логику для представления знаний и рассуждений. Сильные стороны: Отлично подходит для дедуктивных и абдуктивных рассуждений, представления гипотез и создания явных, объяснимых моделей. Слабые стороны: Испытывает трудности с обучением на сырых данных (индукция), масштабируемостью и обработкой неопределённости или перцептивных задач.

3.2 Эмерджентистский подход

Эта парадигма, примером которой являются коннекционистские модели, такие как глубокое обучение, стремится к тому, чтобы интеллект возникал из взаимодействия простых компонентов. Сильные стороны: Мощны в индуктивном выводе из больших наборов данных, распознавании образов и перцептивных задачах. Слабые стороны: Слабы в явных рассуждениях, абдукции, каузальном моделировании и часто представляют собой «чёрный ящик», лишённый объяснимости.

3.3 Универсалистский подход

Эта парадигма ищет единую, математически общую структуру для интеллекта, часто основанную на алгоритмической теории информации или индукции Соломонова. Сильные стороны: Теоретически элегантна и универсальна. Слабые стороны: Вычислительно неразрешима, что делает практическую реализацию в настоящее время невозможной.

4. К единой архитектуре

В статье делается вывод, что ни одна из существующих парадигм не удовлетворяет всем требованиям к Искусственному учёному. Необходим гибридный или единый подход. Вкратце рассматриваются теории, сочетающие элементы, такие как нейро-символьный ИИ, который интегрирует устойчивое обучение нейронных сетей со структурированным рассуждением символьных систем, как перспективное направление для удовлетворения многогранных требований научного открытия.

5. Ключевая идея и перспектива аналитика

Ключевая идея: «Искусственный учёный» — это не просто инструмент автоматизации, а предельный стресс-тест для ИИО. Он требует слияния способностей — обучения на данных, логической строгости, каузального понимания и ясности коммуникации — которые современные изолированные системы ИИ по отдельности неспособны предоставить. В статье верно отмечается, что пропасть между ИИ, ищущим закономерности (эмерджентистский), и ИИ, следующим правилам (логицистский), является основным препятствием.

Логическая последовательность: Аргументация элегантно проста: определить основные эпистемические действия учёного, сопоставить их с когнитивными способностями, а затем беспристрастно проверить существующие парадигмы ИИО по этому списку. Неспособность каждой парадигмы по ключевым пунктам логически приводит к выводу о необходимости интеграции. Упоминание «Гильотины Юма» в отношении оценки гипотез — это тонкий философский штрих, подчёркивающий неизбежную потребность во встроенных ценностях или эвристиках в любом автономном учёном.

Сильные и слабые стороны: Сила статьи — в её чётком, основанном на требованиях деконструировании грандиозной задачи. Она избегает расплывчатых обещаний и фокусируется на конкретных пробелах в возможностях. Однако её главный недостаток — поверхностное рассмотрение предлагаемого решения. Упоминание «гибридных подходов» — это избитый троп в ИИ. Настоящее понимание заключалось бы в предложении конкретной архитектурной схемы или минимальной жизнеспособной интеграции, подобно тому, как статья о CycleGAN предоставила конкретную структуру для непарного преобразования изображений. Без этого вывод кажется необходимым, но недостаточным шагом.

Практические выводы: Для исследователей непосредственный вывод заключается в том, чтобы перестать рассматривать нейро-символьный ИИ как узкоспециальный интерес. Он должен стать центральной исследовательской программой для ИИ-для-науки. Финансирующие организации, такие как программа DARPA ASDF, должны отдавать приоритет архитектурам, которые явно связывают нейронное восприятие с движками символьных рассуждений. Для индустрии фокус должен быть на разработке «инструментов каузального открытия», которые можно интегрировать с большими языковыми моделями, выходя за рамки корреляции к генерации действенных гипотез. Путь к Искусственному учёному начинается с создания ИИ, которые могут не только прочитать 100 000 статей, но и выявить одно ошибочное предположение, которое их всех объединяет — задача, требующая гибридного разума, который представляют авторы.

6. Технические детали и математический аппарат

Требования подразумевают формальную структуру. Оценку гипотез можно представить как задачу оптимизации, балансирующую правдоподобие и полезность. Упрощённая формализация для выбора гипотезы $h$ из пространства $H$ при данных $D$ и функции полезности $U$ может быть следующей:

$$h^* = \arg\max_{h \in H} \left[ \alpha \cdot \log P(h|D) + \beta \cdot U(h) \right]$$

Где:

$P(h|D)$ — апостериорная правдоподобность гипотезы при данных (требует байесовского вывода или аппроксимаций).
$U(h)$ — функция полезности, оценивающая «выгоду» исследования $h$ (например, потенциал для революционного открытия, практическое применение).
$\alpha$ и $\beta$ — параметры, балансирующие две цели, представляющие внутренние «ценности» агента.

Абдукцию можно рассматривать как процесс генерации кандидатов $h$ из $H$, имеющих не пренебрежимо малую $P(h|D)$. Универсалистские подходы могут определять $P(h|D)$ с помощью алгоритмической вероятности, в то время как эмерджентистские подходы будут обучать её на данных, а логицистские подходы могут выводить её из базы знаний.

7. Аналитическая структура: пример из практики

Сценарий: ИИ анализирует данные общественного здравоохранения и наблюдает корреляцию между Регионом А и более высокой заболеваемостью Болезнью X.

Чисто эмерджентистская (глубокое обучение) модель: Определяет закономерность с высокой точностью. На вопрос «почему?» может только выделить влияющие факторы (например, индекс качества воздуха в Регионе А является главным предиктором). Она не может предложить проверяемую механистическую гипотезу, такую как «Загрязнитель Y, распространённый в Регионе А, ингибирует клеточный процесс Z, приводя к Болезни X».

Чисто логицистская (символьная) модель: Имеет базу знаний по биологии. Может рассуждать, что «Ингибирование процесса Z может вызывать Болезнь X» и что «Загрязнитель Y является ингибитором Z». Однако ей может не хватать способности обнаружить новую статистическую связь между Регионом А и болезнью из сырых, неструктурированных наборов данных.

Гибридный нейро-символьный подход:

Восприятие/Индукция (Нейронная сеть): Обнаруживает корреляцию между Регионом А и Болезнью X из данных.
Символьное заземление: Сопоставляет «Регион А» с известными фактами в своей базе знаний: «В Регионе А высокий уровень Загрязнителя Y».
Абдукция (Символьный движок рассуждений): Запрашивает свой биологический граф знаний: «Каковы известные причины Болезни X? Можно ли связать Загрязнитель Y с любой из этих причин?» Находит связь с клеточным процессом Z.
Формирование гипотезы: Генерирует проверяемую, каузальную гипотезу: «Загрязнитель Y вызывает Болезнь X, ингибируя процесс Z».
Проектирование эксперимента: Использует каузальное рассуждение, чтобы предложить эксперимент in vitro с воздействием Загрязнителя Y на клетки и измерением активности процесса Z.

Этот пример иллюстрирует, как гибридная модель выполняет полный рабочий процесс Искусственного учёного, где отдельные парадигмы терпят неудачу.

8. Будущие применения и направления

Ближайшая перспектива (5-10 лет): Разработка «ИИ-ассистентов для исследований», которые радикально ускоряют обзор литературы, генерацию гипотез и проектирование экспериментов в таких областях, как материаловедение (открытие новых катализаторов) и разработка лекарств (выявление новых путей воздействия лекарств). Это будут узконаправленные гибридные системы.

Среднесрочная перспектива (10-20 лет): Автономные системы открытий, работающие в областях, богатых данными, но бедных теориями. Примеры включают анализ астрономических данных с телескопов, таких как JWST, для предложения новых астрофизических моделей, или просеивание геномных и протеомных данных для выявления сложных этиологий заболеваний, выходящих за пределы человеческого распознавания образов.

Долгосрочная перспектива и спекулятивная: Истинные Искусственные учёные, способные на смену парадигм в фундаментальной физике (например, предложение и проверка теорий квантовой гравитации) или математике (генерация и доказательство глубоких гипотез). Это потребует прогресса не только в архитектуре ИИ, но и в автоматизированном физическом экспериментировании (роботизированные лаборатории) и, возможно, новых формах математики, ориентированной на машины. Конечная цель — ИИ, который может переопределить сам научный метод, исследуя стратегии вывода, непостижимые для человеческого разума.

9. Ссылки

Goertzel, B. (2014). Artificial General Intelligence: Concept, State of the Art, and Future Prospects. Journal of Artificial General Intelligence, 5(1), 1-48.
Bringsjord, S., & Licato, J. (2012). Psychometric Artificial General Intelligence: The Piaget-MacGuyver Room. In Theoretical Foundations of Artificial General Intelligence (pp. 25-48). Atlantis Press.
Pearl, J. (2009). Causality: Models, Reasoning, and Inference (2nd ed.). Cambridge University Press.
Marcus, G. (2020). The Next Decade in AI: Four Steps Towards Robust Artificial Intelligence. arXiv preprint arXiv:2002.06177.
Garcez, A. d., & Lamb, L. C. (2020). Neurosymbolic AI: The 3rd Wave. arXiv preprint arXiv:2012.05876.
King, R. D., et al. (2009). The Automation of Science. Science, 324(5923), 85-89.
Hutter, M. (2005). Universal Artificial Intelligence: Sequential Decisions Based on Algorithmic Probability. Springer.
DARPA. Automated Scientific Discovery Framework (ASDF) Program. Retrieved from https://www.darpa.mil.