Mistral AI Meluncurkan Model Sumber Terbuka untuk Aksesibilitas Global

21

Pengembang AI asal Perancis, Mistral AI, telah meluncurkan rangkaian model bahasa baru yang dirancang untuk memperluas akses terhadap kecerdasan buatan yang mutakhir, terlepas dari lokasi geografis, keandalan internet, atau bahasa yang digunakan. Rilis ini mencakup model berskala besar untuk keperluan umum dan versi lebih kecil yang dapat disesuaikan yang dimaksudkan untuk diterapkan pada berbagai perangkat.

Memperluas AI Melampaui Sistem yang Berpusat pada Inggris

Inti dari peluncuran ini adalah Mistral Large 3, model berperforma tinggi yang bersaing dengan penawaran dari OpenAI dan Google. Namun Mistral membedakan dirinya dengan mengutamakan kemampuan multibahasa. Sebagian besar tolok ukur AI yang ada saat ini sangat mengutamakan performa bahasa Inggris, dan sering kali mengorbankan akurasi dalam bahasa lain. Mistral sengaja meningkatkan proporsi data pelatihan non-Inggris untuk memastikan modelnya berperforma baik secara konsisten di berbagai bahasa.

Menurut salah satu pendiri Mistral, Guillaume Lample, banyak perusahaan menghindari fokus pada dukungan multibahasa karena hal itu dapat sedikit mengurangi skor pada tolok ukur bahasa Inggris yang populer. Mistral memilih untuk memprioritaskan kegunaan global dibandingkan peringkat papan peringkat. Pergeseran ini penting karena aksesibilitas AI bukan hanya soal biaya; ini tentang kesetaraan linguistik.

Model Lebih Kecil untuk Aplikasi Lebih Luas

Bersamaan dengan model andalan Large 3, Mistral memperkenalkan rangkaian Ministral 3 : rangkaian model yang lebih kecil (parameter 3 miliar, 8 miliar, dan 14 miliar) dengan variasi yang disesuaikan untuk berbagai kasus penggunaan. Model yang lebih kecil ini dirancang untuk efisiensi, memungkinkannya dijalankan di perangkat seperti laptop, ponsel pintar, mobil, dan robot.

Tiga variasi dalam keluarga Ministral 3 meliputi:

  • Model dasar : Dapat disesuaikan oleh pengguna untuk tugas tertentu.
  • Model yang disempurnakan : Dioptimalkan oleh Mistral untuk kinerja umum.
  • Model penalaran : Dirancang untuk pemrosesan berulang guna menghasilkan jawaban berkualitas lebih tinggi.

Pendekatan berjenjang ini mengakui bahwa banyak pengguna AI memprioritaskan fungsionalitas khusus dibandingkan kekuatan mentah model yang lebih besar. Dengan mengizinkan pengembang untuk menghosting model ini di server mereka sendiri, Mistral juga mengatasi kekhawatiran tentang privasi data dan biaya operasional.

Fungsi Offline dan Komputasi Tepi

Keuntungan utama model yang lebih kecil adalah kemampuannya untuk beroperasi offline. Hal ini penting untuk aplikasi di lingkungan di mana akses internet yang andal tidak tersedia, seperti robotika atau kendaraan otonom. Kemampuan untuk menjalankan AI secara langsung di perangkat juga meningkatkan privasi dengan menjaga data tetap lokal, dan mengurangi konsumsi energi.

“Kami sangat yakin hal ini akan membuat AI dapat diakses oleh semua orang, dan pada dasarnya menempatkan AI di tangan mereka.” — Guillaume Lample, salah satu pendiri Mistral AI.

Pendekatan Mistral mencerminkan perubahan dari tren AI yang terpusat dan berbasis cloud. Dengan menawarkan model open-weight yang dapat berjalan di perangkat, perusahaan mendorong ekosistem AI yang lebih terdesentralisasi dan inklusif.

Implikasi yang lebih luas sudah jelas: AI bergerak melampaui kendali beberapa pemain besar menuju masa depan yang lebih terdistribusi dan mudah diakses. Pergeseran ini kemungkinan akan mempercepat inovasi dan memberdayakan pengembang di seluruh dunia untuk menciptakan solusi AI yang disesuaikan dengan kebutuhan dan bahasa spesifik mereka.