В рамках значительного скачка в развитии искусственного интеллекта исследовательская группа из Пекинского университета разработала систему ИИ, способную самостоятельно решать сложные, нерешенные математические задачи. Система успешно справилась с алгебраической гипотезой десятилетней давности, что знаменует переход от использования ИИ в качестве простого помощника к его роли как автономного исследователя.
Решение алгебраической гипотезы
В центре этого прорыва лежала алгебраическая гипотеза, впервые предложенная в 2014 году покойным Дэном Андерсоном, бывшим профессором Университета Айовы. На протяжении десяти лет эта проблема оставалась открытым вызовом в области коммутативной алгебры.
В отличие от предыдущих моделей ИИ, требующих постоянного руководства со стороны человека, эта новая система обработала десятилетия математической литературы, чтобы решить гипотезу, и — что критически важно — самостоятельно верифицировала свои результаты без вмешательства человека. Весь процесс занял всего 80 часов работы.
Архитектура автономии: Rethlas и Archon
Чтобы преодолеть традиционные ограничения ИИ в математике, исследователи отошли от стандартных больших языковых моделей (LLM), которые часто склонны к «галлюцинациям» или логическим ошибкам. Вместо этого они создали структуру из двух агентов, предназначенную для имитации строгого рабочего процесса профессиональных математиков:
- Агент рассуждений (Rethlas): Эта система выступает в роли «мыслителя». Она использует поисковик теорем под названием Matlas для изучения различных стратегий и математических путей решения задачи.
- Агент формализации (Archon): Как только потенциальное доказательство найдено, управление переходит к Archon. Используя инструмент LeanSearch, он переводит неформальные рассуждения в формальный, проверяемый машиной формат.
- Верификатор (Lean 4): Система использует Lean 4 — специализированный язык программирования и интерактивный помощник по доказательству теорем — чтобы гарантировать, что доказательство математически обосновано и не содержит ошибок.
Почему это важно: от помощи к автоматизации
Современные тенденции в области ИИ демонстрируют мощный вектор на обучение моделей математике, однако большинство из них все еще сталкиваются с «проблемой строгости». В то время как люди способны писать доказательства, они могут допускать ошибки; в то время как LLM могут быстро генерировать текст, им часто не хватает логической точности, необходимой для высшей математики.
Исследование Пекинского университета устраняет этот пробел путем интеграции рассуждений на естественном языке с формальной верификацией. Такой двойной подход гарантирует, что ИИ не просто «угадывает» ответ, а выстраивает доказательство, правильность которого может быть математически подтверждена.
Более того, исследователи отметили, что ИИ продемонстрировал уникальную способность выполнять задачи, которые обычно требуют междисциплинарного сотрудничества, фактически действуя как группа экспертов, работающих в тандеме.
Будущее математических исследований
Несмотря на то, что система работала автономно, исследователи отметили, что вмешательство человека все еще может служить ускорителем. Математик, направляющий агента «Archon», может ускорить процесс формализации, что открывает путь к будущему, где люди и ИИ работают в высокоскоростном симбиотическом цикле.
«Эта работа является конкретным примером того, как математические исследования могут быть существенно автоматизированы с помощью ИИ», — заявили исследователи.
Заключение
Сочетая логические рассуждения со строгой формальной верификацией, эта новая архитектура выводит ИИ за рамки простых вычислений в область автономных научных открытий. Данный прорыв прокладывает путь для решения ИИ все более сложных задач в математике и других высокотехнологичных научных областях.
