OpenAI baru-baru ini meluncurkan GPT-5.2, model AI terbarunya, seiring dengan semakin ketatnya persaingan di pasar. Rilis ini dilakukan di tengah laporan bahwa OpenAI kalah bersaing dengan pesaingnya seperti Google Gemini 3 dan Grok 4.1 dari Elon Musk. Meskipun GPT-5.2 tampak bersaing dengan Gemini 3, Grok 4.1 tetap menjadi pesaing kuat. Berikut rincian bagaimana keduanya dibandingkan dalam tolok ukur, harga, dan fitur.
Tolok Ukur Kinerja: GPT-5.2 Memimpin
Data awal menunjukkan bahwa GPT-5.2 secara konsisten mengungguli Grok 4.1 di berbagai tolok ukur, meskipun verifikasi independen masih menunggu keputusan. OpenAI melaporkan keuntungan signifikan di bidang-bidang utama:
- Penulisan Kreatif v3: GPT-5.2 mencapai Skor ELO sebesar 1675,5, dibandingkan dengan Grok 4.1 yang memperoleh skor 1268,6.
- GDPval-AA: GPT-5.2 mendapat skor 1474, sedangkan Grok 4.1 mencapai 1041.
- GPQA Diamond: GPT-5.2 mencapai akurasi 90,3%, sedikit lebih tinggi dibandingkan Grok 4.1 yang mencapai 87,7%.
Angka-angka ini menunjukkan bahwa GPT-5.2 memiliki keunggulan dalam tugas-tugas kreatif dan penalaran yang kompleks. Namun, kinerja di dunia nyata mungkin berbeda tergantung pada aplikasi spesifik.
Ketersediaan dan Fitur: Kemampuan Serupa
Kedua model dapat diakses oleh publik melalui ChatGPT OpenAI dan platform chat Grok. Keduanya menawarkan fungsionalitas chatbot AI dan kemampuan menghasilkan gambar. ChatGPT terintegrasi dengan Sora 2 untuk pembuatan video, sedangkan Grok menggunakan Grok Imagine. Namun, kedua platform tersebut tertinggal dari pesaing seperti Google Veo 3 dan LumaAI’s Ray3 dalam kualitas video.
ChatGPT memiliki integrasi yang lebih luas di seluruh produk, menawarkan ketersediaan yang sedikit lebih luas dibandingkan Grok.
Harga: GPT-5.2 Menawarkan Titik Masuk yang Lebih Rendah
GPT-5.2 memerlukan langganan ChatGPT Pro, mulai dari $20 per bulan, dengan paket premium mencapai $200. Akses Grok 4.1 memerlukan langganan SuperGrok, mulai dari $30 per bulan dan ditingkatkan hingga $300.
GPT-5.2 lebih terjangkau bagi pengguna biasa, meskipun pilihan terbaik pada akhirnya bergantung pada kebutuhan individu dan pola penggunaan. Tolok ukur dan label harga adalah hal kedua yang menentukan seberapa baik kinerja masing-masing model untuk tugas spesifik Anda.
Pengungkapan: Perusahaan induk Mashable, Ziff Davis, telah mengajukan gugatan terhadap OpenAI, dengan tuduhan pelanggaran hak cipta dalam proses pelatihan AI-nya. Sengketa hukum ini tidak berdampak pada perbandingan kinerja yang diuraikan dalam artikel ini.
Pada akhirnya, GPT-5.2 saat ini unggul dalam skor benchmark dan harga, namun lanskap AI berkembang pesat. Pengguna harus mengevaluasi kedua model berdasarkan kebutuhan unik mereka untuk menentukan alat yang paling efektif untuk kebutuhan mereka.





























