Dalam lompatan signifikan dalam kecerdasan buatan, tim peneliti dari Universitas Peking telah mengembangkan sistem AI yang mampu memecahkan masalah matematika yang kompleks dan belum terpecahkan secara mandiri. Sistem ini berhasil mengatasi dugaan aljabar yang sudah berumur satu dekade, menandai pergeseran dari AI yang hanya sekedar asisten menjadi AI yang berfungsi sebagai peneliti otonom.
Mematahkan Dugaan Aljabar
Masalah yang menjadi inti terobosan ini adalah dugaan aljabar yang pertama kali diajukan pada tahun 2014 oleh mendiang Dan Anderson, mantan profesor di Universitas Iowa. Selama sepuluh tahun, permasalahan tersebut tetap menjadi tantangan terbuka di bidang aljabar komutatif.
Tidak seperti model AI sebelumnya yang memerlukan bimbingan manusia terus-menerus, sistem baru ini memproses literatur matematika selama puluhan tahun untuk menyelesaikan dugaan tersebut dan—yang terpenting—memverifikasi temuannya sendiri tanpa campur tangan manusia. Seluruh proses selesai dalam waktu 80 jam runtime.
Arsitektur Otonomi: Rethlas dan Archon
Untuk mengatasi keterbatasan tradisional AI dalam matematika, para peneliti beralih dari Model Bahasa Besar (LLM) standar, yang sering kali rentan terhadap “halusinasi” atau kesalahan logika. Sebaliknya, mereka membangun kerangka kerja agen ganda yang dirancang untuk meniru alur kerja ketat para ahli matematika manusia:
- Agen Penalaran (Rethlas): Sistem ini bertindak sebagai “pemikir”. Ini menggunakan mesin pencari teorema yang disebut Matlas untuk mengeksplorasi berbagai strategi dan jalur matematika untuk memecahkan suatu masalah.
- Agen Formalisasi (Archon): Setelah bukti potensial ditemukan, Archon mengambil alih. Dengan menggunakan LeanSearch, ini menerjemahkan alasan informal ke dalam format formal yang dapat diverifikasi mesin.
- Verifier (Lean 4): Sistem menggunakan Lean 4, bahasa pemrograman khusus dan pembukti teorema interaktif, untuk memastikan pembuktian secara matematis masuk akal dan bebas dari kesalahan.
Mengapa Ini Penting: Dari Bantuan hingga Otomatisasi
Tren AI saat ini menunjukkan dorongan besar terhadap model pelatihan matematika, namun sebagian besar masih kesulitan mengatasi “kesenjangan kekakuan”. Meskipun manusia bisa menulis bukti, mereka bisa membuat kesalahan; Meskipun LLM dapat menghasilkan teks dengan cepat, LLM sering kali tidak memiliki ketepatan logika yang diperlukan untuk matematika tingkat tinggi.
Studi Universitas Peking ini mengatasi kesenjangan ini dengan mengintegrasikan penalaran bahasa alami dengan verifikasi formal. Pendekatan ganda ini memastikan bahwa AI tidak hanya “menebak” sebuah jawaban, namun membangun bukti yang dapat dibuktikan kebenarannya secara matematis.
Lebih lanjut, para peneliti mencatat bahwa AI menunjukkan kemampuan unik untuk melakukan tugas-tugas yang biasanya memerlukan kolaborasi interdisipliner, dan secara efektif bertindak sebagai banyak ahli yang bekerja bersama-sama.
Masa Depan Penelitian Matematika
Meskipun sistem ini beroperasi secara mandiri, para peneliti mencatat bahwa campur tangan manusia masih dapat bertindak sebagai akselerator. Seorang ahli matematika yang memandu agen “Archon” dapat mempercepat proses formalisasi, menunjukkan masa depan di mana manusia dan AI bekerja dalam lingkaran simbiosis berkecepatan tinggi.
“Pekerjaan ini memberikan contoh nyata bagaimana penelitian matematika dapat diotomatisasi secara substansial menggunakan AI,” kata para peneliti.
Kesimpulan
Dengan menggabungkan penalaran dan verifikasi formal yang ketat, kerangka kerja baru ini menggerakkan AI lebih dari sekadar komputasi sederhana dan memasuki ranah penemuan ilmiah yang otonom. Terobosan ini membuka jalan bagi AI untuk mengatasi permasalahan yang semakin kompleks dalam matematika dan bidang ilmu pengetahuan teknis lainnya.






























