La scorsa settimana, l’industria tecnologica è stata mandata in tilt da un annuncio sorprendente di Anthropic: hanno sviluppato un modello di intelligenza artificiale così potente nel campo della sicurezza informatica da essere ritenuto troppo pericoloso per il rilascio pubblico.
Soprannominato Claude Mythos Preview, il modello è in grado di identificare migliaia di vulnerabilità ad alta gravità nei principali sistemi operativi e browser web. Per gestire questo rischio, Anthropic ha lanciato il Progetto Glasswing, un’iniziativa solo su invito che consente ad organizzazioni selezionate di testare il modello e proteggere la propria infrastruttura digitale.
Sebbene l’annuncio abbia innescato discussioni di emergenza tra i leader finanziari e suscitato timori di attacchi hacker diffusi, rimane una domanda centrale: Si tratta di un vero salto di qualità nelle capacità dell’intelligenza artificiale o di una calcolata trovata di pubbliche relazioni progettata per stimolare gli investimenti?
Il caso di una trovata pubblicitaria: “Teatro aziendale”
Critici e scettici sostengono che l’approccio “la sicurezza prima di tutto” di Anthropic ha un duplice scopo: proteggere il pubblico e costruire un marchio di potere indispensabile.
- Dati vaghi: L’ingegnere della sicurezza AI Heidy Khlaaf sottolinea che Anthropic ha nascosto parametri critici, come il tasso di “falsi positivi” e quanto intervento umano è stato necessario per verificare i risultati del modello. Senza questi dati, gli esperti indipendenti non possono convalidare le affermazioni.
- Il “Marketing Flex”: Tal Kollender, CEO della società di sicurezza informatica Remedio, descrive la mossa come un “brillante teatro aziendale”. Etichettando il modello “troppo pericoloso per essere rilasciato”, Anthropic crea un’aura di mistica e segnala agli investitori un immenso dominio tecnologico.
- Precedente storico: Anthropic ha una storia di terribili avvertimenti sui propri modelli. Gli scettici notano che alcuni precedenti comportamenti “pericolosi” erano in realtà il risultato di ambienti di test artificiali altamente controllati piuttosto che di intenti di modelli autonomi.
Le ragioni di una vera minaccia: una nuova scala di sfruttamento
Nonostante lo scetticismo, test indipendenti suggeriscono che Claude Mythos non è solo una montatura. L’AI Security Institute (AISI) ha recentemente verificato che Mythos ha superato i test di sicurezza informatica che nessun altro modello di frontiera ha completato con successo.
Il vero pericolo non è necessariamente uno “scenario hollywoodiano” in cui un adolescente hackera una rete elettrica, ma piuttosto un cambiamento nella dimensione e nella velocità degli attacchi informatici :
- Rilevamento automatizzato: A differenza degli strumenti attuali, Mythos può automatizzare il rilevamento delle vulnerabilità “zero-day” (difetti precedentemente sconosciuti) su una scala senza precedenti.
- Sfruttamento rapido: gruppi di hacker sofisticati potrebbero utilizzare tali modelli per individuare e sfruttare i punti deboli più velocemente di quanto i difensori umani riescano a risolverli.
- Capacità comprovate: Il ricercatore Nicholas Carlini ha osservato che Mythos ha già identificato le vulnerabilità in Linux che consentono l’accesso amministrativo non autorizzato, dimostrando la sua potenza tecnica.
La terra di mezzo: un’arma a doppio taglio
Per molti esperti, la risposta non è un “o/o”, ma entrambi. È probabile che Anthropic stia dicendo la verità sul potere del modello e allo stesso tempo utilizzi quella verità per rafforzare la propria posizione sul mercato.
“Direi che sono entrambe le cose, e questa non è una critica… Qualsiasi importante lancio di piattaforme in quest’epoca apparirà diverso a pubblici diversi a seconda della loro fluidità e della loro tolleranza alla paura.”
— Howie Xu, Direttore AI e Innovazione presso Gen
La realtà attuale è una corsa agli armamenti asimmetrica. Sebbene Claude Mythos presenti un rischio significativo per la sicurezza, la stessa tecnologia offre un enorme vantaggio a coloro che difendono la frontiera digitale. Man mano che l’intelligenza artificiale diventa più capace di individuare i bug, le organizzazioni incaricate di risolverli disporranno di strumenti altrettanto potenti per automatizzare la difesa.
Conclusione: Claude Mythos rappresenta un vero salto tecnologico che automatizza la scoperta delle vulnerabilità digitali, ma il lancio ad alto rischio di Anthropic è anche un masterclass nel posizionamento strategico. Il vero impatto sarà determinato dalla capacità dei difensori di utilizzare questi stessi strumenti “pericolosi” per superare gli hacker.
