Průlom nebo masivní bluf? Celá pravda o „nebezpečné“ nové umělé inteligenci Anthropic

12

Minulý týden otřáslo technologickým průmyslem překvapivé oznámení společnosti Anthropic, že vyvinula model umělé inteligence tak výkonný v oblasti kybernetické bezpečnosti, že byl považován za příliš nebezpečný pro zveřejnění.

Model s názvem Claude Mythos Preview je údajně schopen identifikovat tisíce kritických zranitelností v hlavních operačních systémech a webových prohlížečích. Pro zmírnění rizika spustil Anthropic Project Glasswing, soukromou iniciativu pouze pro pozvání, která umožňuje vybraným organizacím testovat model a chránit jejich digitální infrastrukturu.

I když toto oznámení vyvolalo naléhavou debatu mezi finančními lídry a vyvolalo obavy z rozšířeného hackování, hlavní otázkou zůstává: Jde o skutečný skok ve schopnostech umělé inteligence, nebo jde o vypočítavý PR trik, který má přilákat investice?

Argumenty ve prospěch PR: „Firemní divadlo“

Kritici a skeptici tvrdí, že přístup společnosti Anthropic „bezpečnost především“ má dvojí účel: chránit veřejnost a vytvářet image značky nenahraditelné síly.

  • Data mezera: Bezpečnostní inženýrka AI Heidi Klaaf poznamenává, že společnost Anthropic skryla kritické metriky, jako je míra „falešných poplachů“ a množství lidského zásahu potřebného k ověření výstupu modelu. Bez těchto údajů nemohou nezávislí odborníci tvrzení společnosti potvrdit.
  • „Marketingová ukázka síly“: Tal Collender, generální ředitel společnosti Remedio zabývající se kybernetickou bezpečností, popisuje tento krok jako „skvělé firemní divadlo“. Tím, že Anthropic nazval model „příliš nebezpečným na to, aby byl uvolněn, vytváří auru tajemna a ukazuje investorům svou obrovskou technologickou převahu.
  • Historické precedenty: Společnost Anthropic má za sebou historii vydávání červených vlajek ohledně svých vlastních modelů. Skeptici poukazují na to, že některé předchozí případy „nebezpečného“ chování byly ve skutečnosti spíše výsledkem práce ve vysoce kontrolovaných umělých testovacích prostředích, než projevem autonomního záměru modelu.

Argumenty pro skutečnou hrozbu: Nový rozsah vykořisťování

Navzdory skepticismu nezávislé testování ukazuje, že Claude Mythos je víc než jen humbuk. Institut AI ​​Security Institute (AISI) nedávno potvrdil, že Mythos prošel testy kybernetické bezpečnosti, kterými neprošel žádný jiný špičkový model.

Skutečným nebezpečím nemusí být nutně „hollywoodský scénář“ teenagera, který se nabourá do rozvodné sítě, ale spíše měnící se rozsah a rychlost kybernetických útoků :

  1. Automatizované zjišťování: Na rozdíl od stávajících nástrojů dokáže Mythos automatizovat vyhledávání zranitelností zero-day (dříve neznámých zranitelností) v bezprecedentním měřítku.
  2. Rychlé využití: Důmyslné hackerské skupiny mohou tyto modely využít k nalezení a využití slabin rychleji, než mohou bezpečnostní týmy vydávat záplaty.
  3. Ověřené schopnosti: Výzkumník Nicholas Carlini poznamenal, že Mythos již objevil v Linuxu zranitelnosti, které umožňují neoprávněný administrativní přístup, což dokazuje jeho technický potenciál.

Zlatá střední cesta: Dvojsečný meč

Pro mnoho odborníků není odpovědí volba buď/nebo – je to obojí. Anthropic pravděpodobně mluví pravdu o síle modelu, ale využívá tuto pravdu k posílení své pozice na trhu.

“Řekl bych, že obě tvrzení jsou pravdivá, a to není kritika… Každé spuštění velké platformy v této éře bude různým publikem vnímáno odlišně v závislosti na jejich povědomí a míře tolerance strachu.”
Howie Xu, ředitel AI a inovací ve společnosti Gen

Současná realita je asymetrický závod ve zbrojení. Zatímco Claude Mythos představuje významné bezpečnostní riziko, stejná technologie poskytuje obrovskou výhodu těm, kteří chrání digitální hranici. Jak bude umělá inteligence schopnější nacházet chyby, budou mít organizace odpovědné za jejich opravu k dispozici stejně výkonné nástroje pro automatizaci zabezpečení.


Závěr: Claude Mythos představuje skutečný technologický skok v automatizaci vyhledávání digitálních zranitelností, ale riskantní spuštění projektu Anthropic je mistrovskou třídou strategického umístění. Skutečný dopad bude záviset na tom, zda obránci dokážou použít stejné „nebezpečné“ nástroje, aby si udrželi náskok před hackery.