AI bereikt mijlpaal door tien jaar oude wiskundige vermoedens op te lossen zonder menselijk toezicht

14

In een belangrijke stap voorwaarts op het gebied van kunstmatige intelligentie heeft een onderzoeksteam van de Peking Universiteit een AI-systeem ontwikkeld dat in staat is om complexe, onopgeloste wiskundige problemen geheel zelfstandig op te lossen. Het systeem pakte met succes een tien jaar oud algebra-vermoeden aan en markeerde een verschuiving van AI als louter assistent naar AI als autonome onderzoeker.

Het algebra-vermoeden doorbreken

Het probleem dat centraal stond in deze doorbraak was een algebra-vermoeden dat voor het eerst werd voorgesteld in 2014 door wijlen Dan Anderson, een voormalig professor aan de Universiteit van Iowa. Tien jaar lang bleef het probleem een ​​open uitdaging op het gebied van de commutatieve algebra.

In tegenstelling tot eerdere AI-modellen die constante menselijke begeleiding vereisen, verwerkte dit nieuwe systeem tientallen jaren aan wiskundige literatuur om het vermoeden op te lossen en – cruciaal – verifieerde het zijn eigen bevindingen zonder menselijke tussenkomst. Het hele proces werd binnen 80 uur runtime voltooid.

De architectuur van autonomie: Rethlas en Archon

Om de traditionele beperkingen van AI in de wiskunde te overwinnen, stapten de onderzoekers af van de standaard Large Language Models (LLM’s), die vaak vatbaar zijn voor ‘hallucinaties’ of logische fouten. In plaats daarvan bouwden ze een dual-agent-framework dat was ontworpen om de rigoureuze workflow van menselijke wiskundigen na te bootsen:

  1. De Redenerende Agent (Rethlas): Dit systeem fungeert als de ‘denker’. Het maakt gebruik van een stellingenzoekmachine genaamd Matlas om verschillende strategieën en wiskundige paden te verkennen om een ​​probleem op te lossen.
  2. De Formalisatieagent (Archon): Zodra een potentieel bewijs is gevonden, neemt Archon het over. Met behulp van LeanSearch vertaalt het de informele redenering naar een formeel, machinaal verifieerbaar formaat.
  3. De Verifier (Lean 4): Het systeem gebruikt Lean 4, een gespecialiseerde programmeertaal en interactieve stellingbewijzer, om ervoor te zorgen dat het bewijs wiskundig verantwoord is en vrij van fouten.

Waarom dit belangrijk is: van hulp tot automatisering

De huidige AI-trends laten een enorme impuls zien in de richting van trainingsmodellen in de wiskunde, maar de meeste worstelen nog steeds met de ‘rigor gap’. Hoewel mensen proefdrukken kunnen schrijven, kunnen ze fouten maken; Hoewel LLM’s snel tekst kunnen genereren, missen ze vaak de logische precisie die nodig is voor wiskunde op hoog niveau.

Dit onderzoek van de Universiteit van Peking pakt deze kloof aan door natuurlijke taalredenering te integreren met formele verificatie. Deze dubbele aanpak zorgt ervoor dat de AI niet zomaar een antwoord ‘raadt’, maar een bewijs construeert waarvan wiskundig kan worden bewezen dat het juist is.

Bovendien merkten de onderzoekers op dat de AI een uniek vermogen demonstreerde om taken uit te voeren die doorgaans interdisciplinaire samenwerking vereisen, en effectief opereert als meerdere experts die samenwerken.

De toekomst van wiskundig onderzoek

Hoewel het systeem autonoom werkte, merkten de onderzoekers op dat menselijk ingrijpen nog steeds als versneller kan fungeren. Een wiskundige die de ‘Archon’-agent begeleidt, kan het formaliseringsproces versnellen, wat een toekomst suggereert waarin mensen en AI in een snelle, symbiotische lus werken.

“Dit werk biedt een concreet voorbeeld van hoe wiskundig onderzoek substantieel kan worden geautomatiseerd met behulp van AI”, aldus de onderzoekers.

Conclusie
Door redeneren te combineren met rigoureuze formele verificatie, brengt dit nieuwe raamwerk AI verder dan eenvoudige berekeningen en naar het rijk van autonome wetenschappelijke ontdekkingen. Deze doorbraak maakt de weg vrij voor AI om steeds complexere problemen in de wiskunde en andere zeer technische wetenschappelijke gebieden aan te pakken.