Gemma 4 Google: AI Sumber Terbuka Akhirnya Menyamai Model Komersial

21

Google telah merilis rangkaian model AI open-weight terbarunya, Gemma 4, di bawah lisensi Apache 2.0—sebuah perubahan signifikan yang dapat mengubah cara bisnis mengadopsi AI open-source. Selama bertahun-tahun, model Gemma Google telah menawarkan kinerja yang kuat namun terhambat oleh perizinan yang terbatas, sehingga mendorong banyak organisasi menuju alternatif seperti Mistral atau Qwen dari Alibaba. Lisensi Apache 2.0 yang baru menghilangkan hambatan tersebut, memungkinkan penggunaan komersial yang lebih luas tanpa hambatan hukum.

Waktu ini sangat penting, karena beberapa laboratorium AI Tiongkok (seperti Alibaba) mengurangi rilis sumber terbuka penuh untuk model terbaru mereka. Google bergerak ke arah yang berlawanan, membuka rilis Gemma yang paling mumpuni sambil memanfaatkan penelitian dari Gemini 3 miliknya.

Gemma 4: Model untuk Setiap Perangkat

Gemma 4 hadir dalam empat model, dibagi menjadi workstation dan tingkatan edge:

  • Tingkat Workstation: Mencakup model padat parameter 31B dan model Mixture-of-Experts (MoE) A4B 26B, keduanya mendukung jendela konteks teks, gambar, dan 256K token.
  • Edge Tier: Terdiri dari model E2B dan E4B, dirancang untuk ponsel, perangkat tertanam, dan laptop, dengan dukungan untuk jendela konteks teks, gambar, audio, dan 128K token.

Konvensi penamaan sangat penting: “E” menunjukkan “parameter efektif”, yang berarti model berperilaku seperti ukuran yang lebih kecil namun secara teknis lebih besar karena Per-Layer Embeddings (PLE) Google. Huruf “A” di A4B adalah singkatan dari “parameter aktif”, yang menunjukkan bahwa hanya sebagian kecil dari total parameter model yang diaktifkan selama inferensi, sehingga menghasilkan kecerdasan tinggi dengan biaya komputasi lebih rendah.

Arsitektur Kementerian Lingkungan Hidup: Kinerja dengan Efisiensi

Model MoE 26B A4B menggunakan 128 “ahli” kecil, yang hanya mengaktifkan delapan orang per token ditambah satu ahli yang selalu aktif. Hal ini menghasilkan performa yang sebanding dengan model padat dalam rentang 27B–31B, namun dengan kecepatan inferensi serupa dengan model 4B. Ini berarti GPU yang lebih sedikit, latensi yang lebih rendah, dan inferensi per token yang lebih murah untuk beban kerja produksi seperti asisten pengkodean atau pemrosesan dokumen.

Gemma 4 juga menggunakan mekanisme perhatian hibrid yang menggabungkan perhatian jendela geser lokal dengan perhatian global penuh, memungkinkan jendela konteks panjang (256K) tanpa konsumsi memori yang berlebihan.

Multimodalitas Asli: Panggilan Visi, Audio, dan Fungsi

Tidak seperti model terbuka sebelumnya yang hanya mengandalkan multimodalitas, Gemma 4 mengintegrasikan visi, audio, dan pemanggilan fungsi pada tingkat arsitektur:

  • Visi: Mendukung gambar rasio aspek variabel dengan anggaran token visual yang dapat dikonfigurasi untuk tugas-tugas seperti OCR, penguraian dokumen, dan analisis terperinci.
  • Audio: Pemrosesan audio asli (ASR dan terjemahan) pada perangkat, dikompresi menjadi 305 juta parameter untuk responsivitas.
  • Panggilan Fungsi: Terintegrasi dari awal, mengoptimalkan aliran agen multi-putaran dengan beberapa alat dan mengurangi overhead teknis yang cepat.

Tolok Ukur dan Kinerja

Gemma 4 menjadi tolok ukur yang kuat:

  • 31B Padat: 89,2% pada AIME 2026 (penalaran matematis), 80,0% pada LiveCodeBench v6 (coding), dan Codeforces ELO sebesar 2.150.
  • 26B A4B MoE: 88,3% pada AIME 2026, 77,1% pada LiveCodeBench v6, dan 82,3% pada GPQA Diamond (penalaran sains).
  • Model Edge: E4B (42,5% pada AIME 2026) dan E2B (37,5% pada AIME 2026) mengungguli versi Gemma sebelumnya meskipun lebih kecil.

Sementara Qwen, GLM, dan Kimi bersaing dalam rentang parameter ini, Gemma 4 menonjol karena menggabungkan kinerja yang kuat dengan lisensi yang benar-benar permisif dan multimodalitas asli.

Apa Selanjutnya?

Google telah merilis model dasar terlatih dan varian yang disesuaikan dengan instruksi, sehingga mendorong penyesuaian khusus. Opsi penerapan tanpa server melalui Cloud Run dengan dukungan GPU dapat mengurangi biaya penerapan model terbuka dalam produksi secara signifikan. Ukuran model tambahan kemungkinan akan menyusul, namun rangkaian Gemma 4 saat ini menawarkan solusi AI terbuka lengkap yang bersaing dengan model berpemilik. Bagi perusahaan yang ragu untuk mengadopsi AI terbuka karena masalah perizinan, Google kini telah menghilangkan hambatan tersebut.