Przełom czy potężny blef? Cała prawda o „niebezpiecznej” nowej sztucznej inteligencji Anthropic

5

W zeszłym tygodniu branżą technologiczną wstrząsnęło zaskakujące ogłoszenie firmy Anthropic, że opracowała model sztucznej inteligencji tak potężny pod względem cyberbezpieczeństwa, że uznano go za zbyt niebezpieczny, aby można go było udostępnić publicznie.

Według doniesień model o nazwie Claude Mythos Preview jest w stanie zidentyfikować tysiące krytycznych luk w zabezpieczeniach głównych systemów operacyjnych i przeglądarek internetowych. Aby ograniczyć ryzyko, firma Anthropic uruchomiła Project Glasswing, prywatną inicjatywę dostępną wyłącznie na zaproszenie, która umożliwia wybranym organizacjom testowanie modelu i ochronę ich infrastruktury cyfrowej.

Choć ogłoszenie wywołało pilną debatę wśród liderów finansowych i wzbudziło obawy przed powszechnymi włamaniami, główne pytanie pozostaje: Czy jest to prawdziwy skok w możliwościach sztucznej inteligencji, czy też wyrachowany chwyt PR mający na celu przyciągnięcie inwestycji?

Argumenty za PR: „Teatr Korporacyjny”

Krytycy i sceptycy twierdzą, że podejście Anthropic „bezpieczeństwo przede wszystkim” ma podwójny cel: ochronę społeczeństwa i tworzenie wizerunku marki o niezastąpionej mocy.

  • Luka w danych: Heidi Klaaf, inżynier bezpieczeństwa AI, zauważa, że ​​Anthropic ukrył krytyczne wskaźniki, takie jak odsetek „fałszywie pozytywnych wyników” i ilość interwencji człowieka wymaganej do sprawdzenia wyników modelu. Bez tych danych niezależni eksperci nie mogą potwierdzić twierdzeń firmy.
  • „Marketingowy pokaz siły”: Tal Collender, dyrektor generalny firmy Remedio zajmującej się bezpieczeństwem cybernetycznym, opisuje to posunięcie jako „genialny teatr korporacyjny”. Nazywając model „zbyt niebezpiecznym, aby go wypuścić”, Anthropic tworzy aurę tajemniczości i demonstruje inwestorom swoją ogromną przewagę technologiczną.
  • Precedenty historyczne: Anthropic ma historię ostrzegania przed własnymi modelami. Sceptycy zwracają uwagę, że niektóre wcześniejsze przypadki „niebezpiecznych” zachowań były w rzeczywistości wynikiem pracy w ściśle kontrolowanych, sztucznych środowiskach testowych, a nie przejawem autonomicznych zamiarów modelu.

Argumenty za realnym zagrożeniem: Nowa skala wyzysku

Pomimo sceptycyzmu niezależne testy pokazują, że Claude Mythos to coś więcej niż tylko szum. AI ​​Security Institute (AISI) niedawno potwierdził, że Mythos przeszedł testy cyberbezpieczeństwa, których nie przeszedł żaden inny najnowocześniejszy model.

Prawdziwym zagrożeniem niekoniecznie jest „hollywoodzki scenariusz” włamania się nastolatka do sieci energetycznej, ale raczej zmieniająca się skala i prędkość cyberataków :

  1. Automatyczne wykrywanie: W przeciwieństwie do istniejących narzędzi, Mythos może zautomatyzować wyszukiwanie luk typu zero-day (wcześniej nieznanych luk) na niespotykaną dotąd skalę.
  2. Szybka eksploatacja: Wyrafinowane grupy hakerów mogą wykorzystywać te modele do znajdowania i wykorzystywania słabych punktów szybciej, niż zespoły ds. bezpieczeństwa są w stanie wypuszczać łatki.
  3. Potwierdzone możliwości: Badacz Nicholas Carlini zauważył, że Mythos odkrył już luki w Linuksie, które umożliwiają nieautoryzowany dostęp administracyjny, co potwierdza jego potencjał techniczny.

Złoty środek: miecz obosieczny

Dla wielu ekspertów odpowiedź nie brzmi „albo-albo” – raczej jedno i drugie. Anthropic zapewne mówi prawdę o sile modelu, ale wykorzystuje tę prawdę do wzmocnienia swojej pozycji na rynku.

„Powiedziałbym, że oba stwierdzenia są prawdziwe i nie jest to krytyka… Każde uruchomienie dużej platformy w tej epoce będzie różnie postrzegane przez różnych odbiorców, w zależności od ich świadomości i poziomu tolerancji na strach”.
Howie Xu, dyrektor ds. sztucznej inteligencji i innowacji w Gen

Obecna rzeczywistość to asymetryczny wyścig zbrojeń. Chociaż Claude Mythos stwarza poważne ryzyko dla bezpieczeństwa, ta sama technologia zapewnia ogromną przewagę osobom chroniącym granicę cyfrową. W miarę jak sztuczna inteligencja stanie się bardziej zdolna do wyszukiwania błędów, organizacje odpowiedzialne za ich naprawianie będą dysponować równie potężnymi narzędziami do automatyzacji bezpieczeństwa.


Wniosek: Claude Mythos stanowi prawdziwy skok technologiczny w automatyzacji wyszukiwania luk w zabezpieczeniach cyfrowych, ale ryzykowne uruchomienie projektu przez Anthropic to mistrzowska klasa w pozycjonowaniu strategicznym. Prawdziwy wpływ będzie zależał od tego, czy obrońcy będą w stanie wykorzystać te same „niebezpieczne” narzędzia, aby wyprzedzić hakerów.