Terobosan atau Gertakan Besar? Kebenaran di Balik AI Baru yang “Berbahaya” dari Anthropic

18

Pekan lalu, industri teknologi terguncang oleh pengumuman mengejutkan dari Anthropic: mereka telah mengembangkan model AI yang sangat kuat di bidang keamanan siber sehingga dianggap terlalu berbahaya untuk dirilis ke publik.

Dijuluki Claude Mythos Preview, model ini dilaporkan mampu mengidentifikasi ribuan kerentanan dengan tingkat keparahan tinggi di seluruh sistem operasi dan browser web utama. Untuk mengelola risiko ini, Anthropic meluncurkan Project Glasswing, sebuah inisiatif khusus undangan yang memungkinkan organisasi terpilih untuk menguji model dan mengamankan infrastruktur digital mereka.

Meskipun pengumuman tersebut memicu diskusi darurat di antara para pemimpin keuangan dan memicu ketakutan akan peretasan yang meluas, pertanyaan utamanya tetap ada: Apakah ini merupakan lompatan nyata dalam kemampuan AI, atau aksi PR yang diperhitungkan dan dirancang untuk meningkatkan investasi?

Kasus Aksi Publisitas: “Teater Perusahaan”

Kritikus dan skeptis berpendapat bahwa pendekatan Anthropic yang “mengutamakan keselamatan” memiliki dua tujuan: melindungi masyarakat dan membangun kekuatan yang sangat diperlukan.

  • Data Tidak Jelas: Insinyur keselamatan AI Heidy Khlaaf menyatakan bahwa Anthropic telah menyembunyikan metrik penting, seperti tingkat “positif palsu” dan seberapa banyak intervensi manusia yang diperlukan untuk memverifikasi temuan model. Tanpa data ini, para ahli independen tidak dapat memvalidasi klaim tersebut.
  • The “Marketing Flex”: Tal Kollender, CEO perusahaan keamanan siber Remedio, menggambarkan langkah ini sebagai “teater perusahaan yang brilian”. Dengan memberi label pada model tersebut “terlalu berbahaya untuk dirilis”, Anthropic menciptakan aura mistik dan menandakan dominasi teknologi yang sangat besar kepada investor.
  • Preseden Sejarah: Anthropic memiliki sejarah mengeluarkan peringatan mengerikan tentang modelnya sendiri. Para skeptis mencatat bahwa beberapa perilaku “berbahaya” sebelumnya sebenarnya merupakan hasil dari lingkungan pengujian buatan yang sangat terkontrol, bukan niat model otonom.

Kasus Ancaman Asli: Skala Eksploitasi Baru

Meskipun ada skeptisisme, pengujian independen menunjukkan bahwa Claude Mythos bukan sekedar hype. AI Security Institute (AISI) baru-baru ini memverifikasi bahwa Mythos lulus uji keamanan siber yang belum pernah berhasil diselesaikan oleh model frontier lainnya.

Bahaya sebenarnya belum tentu merupakan “skenario Hollywood” di mana seorang remaja meretas jaringan listrik, melainkan pergeseran skala dan kecepatan serangan siber :

  1. Penemuan Otomatis: Tidak seperti alat yang ada saat ini, Mythos dapat mengotomatiskan penemuan kerentanan “zero-day” (kelemahan yang sebelumnya tidak diketahui) pada skala yang belum pernah terjadi sebelumnya.
  2. Eksploitasi Cepat: Kelompok peretas yang canggih dapat menggunakan model seperti itu untuk menemukan dan mengeksploitasi kelemahan lebih cepat daripada yang dapat diperbaiki oleh pembela HAM.
  3. Kemampuan Terbukti: Ilmuwan peneliti Nicholas Carlini mencatat bahwa Mythos telah mengidentifikasi kerentanan di Linux yang memungkinkan akses administratif tanpa izin, yang membuktikan potensi teknisnya.

Jalan Tengah: Pedang Bermata Dua

Bagi banyak pakar, jawabannya bukanlah “salah satu/atau”—melainkan keduanya. Anthropic kemungkinan besar mengatakan kebenaran tentang kekuatan model tersebut sekaligus menggunakan kebenaran tersebut untuk memperkuat posisi pasarnya.

“Menurut saya itu adalah keduanya, dan itu bukan sebuah kritik… Setiap peluncuran platform besar di era ini akan terlihat berbeda bagi audiens yang berbeda tergantung pada kelancaran dan toleransi rasa takut mereka.”
Howie Xu, Chief AI & Innovation Officer di Gen

Kenyataan yang ada saat ini adalah perlombaan senjata asimetris. Meskipun Claude Mythos menimbulkan risiko keamanan yang signifikan, teknologi yang sama memberikan keuntungan besar bagi mereka yang mempertahankan batas digital. Ketika AI menjadi lebih mampu menemukan bug, organisasi yang ditugaskan untuk memperbaikinya akan mendapatkan alat yang sama kuatnya untuk mengotomatisasi pertahanan.


Kesimpulan: Claude Mythos mewakili lompatan teknologi sejati yang mengotomatiskan penemuan kerentanan digital, namun peluncuran Anthropic yang berisiko tinggi juga merupakan masterclass dalam penentuan posisi strategis. Dampak sebenarnya akan ditentukan oleh apakah para pembela HAM dapat menggunakan alat-alat “berbahaya” yang sama untuk mengalahkan para peretas.