Na semana passada, a indústria tecnológica entrou em crise com um anúncio surpreendente da Anthropic: eles desenvolveram um modelo de IA tão poderoso no domínio da segurança cibernética que é considerado muito perigoso para divulgação pública.
Apelidado de Claude Mythos Preview, o modelo é supostamente capaz de identificar milhares de vulnerabilidades de alta gravidade nos principais sistemas operacionais e navegadores da web. Para gerenciar esse risco, a Anthropic lançou o Projeto Glasswing, uma iniciativa somente para convidados que permite que organizações selecionadas testem o modelo e protejam sua infraestrutura digital.
Embora o anúncio tenha desencadeado discussões de emergência entre os líderes financeiros e provocado receios de pirataria informática generalizada, permanece uma questão central: Será este um salto genuíno na capacidade da IA, ou um golpe de relações públicas calculado concebido para angariar investimento?
O caso de um golpe publicitário: “Teatro Corporativo”
Críticos e céticos argumentam que a abordagem “segurança em primeiro lugar” da Anthropic serve um propósito duplo: proteger o público e construir uma marca de poder indispensável.
- Dados vagos: A engenheira de segurança de IA Heidy Khlaaf aponta que a Anthropic reteve métricas críticas, como a taxa de “falsos positivos” e quanta intervenção humana foi necessária para verificar as descobertas do modelo. Sem estes dados, os peritos independentes não podem validar as alegações.
- O “Marketing Flex”: Tal Kollender, CEO da empresa de segurança cibernética Remedio, descreve a mudança como um “brilhante teatro corporativo”. Ao rotular o modelo como “muito perigoso para ser lançado”, a Anthropic cria uma aura de mística e sinaliza imenso domínio tecnológico para os investidores.
- Precedente histórico: A Anthropic tem um histórico de emitir alertas terríveis sobre seus próprios modelos. Os céticos observam que alguns comportamentos “perigosos” anteriores foram, na verdade, o resultado de ambientes de teste artificiais altamente controlados, e não da intenção de um modelo autônomo.
O caso de uma ameaça genuína: uma nova escala de exploração
Apesar do ceticismo, testes independentes sugerem que Claude Mythos não é apenas um exagero. O AI Security Institute (AISI) verificou recentemente que a Mythos passou em testes de segurança cibernética que nenhum outro modelo de fronteira concluiu com êxito.
O perigo real não é necessariamente um “cenário de Hollywood”, onde um adolescente invade uma rede elétrica, mas sim uma mudança na escala e velocidade dos ataques cibernéticos :
- Descoberta automatizada: Ao contrário das ferramentas atuais, o Mythos pode automatizar a descoberta de vulnerabilidades de “dia zero” (falhas anteriormente desconhecidas) em uma escala sem precedentes.
- Exploração rápida: Grupos de hackers sofisticados poderiam usar esses modelos para encontrar e explorar pontos fracos mais rápido do que os defensores humanos conseguem corrigi-los.
- Capacidades comprovadas: O cientista pesquisador Nicholas Carlini observou que a Mythos já identificou vulnerabilidades no Linux que permitem acesso administrativo não autorizado, comprovando sua potência técnica.
O meio-termo: uma espada de dois gumes
Para muitos especialistas, a resposta não é “um ou outro” – é ambos. A Anthropic provavelmente está dizendo a verdade sobre o poder do modelo e, ao mesmo tempo, usando essa verdade para reforçar sua posição no mercado.
“Eu diria que são as duas coisas, e isso não é uma crítica… Qualquer grande lançamento de plataforma nesta era parecerá diferente para diferentes públicos, dependendo de sua fluência e tolerância ao medo.”
— Howie Xu, diretor de IA e inovação da Gen
A realidade atual é uma corrida armamentista assimétrica. Embora Claude Mythos represente um risco significativo para a segurança, a mesma tecnologia proporciona uma enorme vantagem para aqueles que defendem a fronteira digital. À medida que a IA se torna mais capaz de encontrar bugs, as organizações encarregadas de corrigi-los ganharão ferramentas igualmente poderosas para automatizar a defesa.
Conclusão: Claude Mythos representa um salto tecnológico genuíno que automatiza a descoberta de vulnerabilidades digitais, mas a implementação de alto risco da Anthropic também é uma aula magistral em posicionamento estratégico. O verdadeiro impacto será determinado pela capacidade dos defensores de usar essas mesmas ferramentas “perigosas” para superar os hackers.






























