Na terça-feira, a Anthropic lançou o Fable, apresentado como uma versão pública e com recursos limitados do Mythos, seu sistema voltado à segurança digital. O lançamento gerou reclamações entre pesquisadores e profissionais de cibersegurança, que dizem que os mecanismos de bloqueio do modelo impedem até atividades consideradas inofensivas.
O que o Fable bloqueia
De acordo com relatos publicados em redes sociais e fóruns especializados e compilados pelo TechCrunch, o Fable interrompe conversas sempre que seus filtros internos detectam temas relacionados à cibersegurança ou biologia. Nessas situações, a ferramenta exibe uma mensagem informando que “medidas de segurança sinalizaram esta mensagem por tópicos de cibersegurança ou biologia” e, automaticamente, retorna ao Claude Opus 4.8.
A Anthropic justifica os bloqueios afirmando que os filtros visam impedir usos maliciosos, como criação de malware ou invasão de sistemas. A empresa também aplica restrições a solicitações ligadas à biologia por receio de uso indevido envolvendo armas biológicas.
Reações de especialistas
Pesquisadores relataram casos em que pedidos simples foram barrados. Valentina “Chompie” Palmiotti, pesquisadora da IBM X-Force, afirmou que o Fable rejeita qualquer solicitação que tenha relação, ainda que tangencial, com cibersegurança — inclusive tarefas como ler uma postagem de blog. Outro pesquisador declarou na plataforma X que pedir uma revisão de código já aciona as barreiras da plataforma.
Matt Suiche, da equipe técnica da Tolmo, startup de segurança digital com IA, disse ao TechCrunch que o sistema tende a classificar pedidos de boas práticas de programação como trabalho de cibersegurança e aplicar restrições. Ele avaliou que os bloqueios parecem baseados em palavras-chave, o que faria com que termos do campo lexical de “cibersegurança” disparassem as limitações. Suiche também declarou compreender a postura preventiva da Anthropic, destacando que restrições mais rígidas no início do lançamento podem ser flexibilizadas com o tempo e com colaboração entre as empresas do setor.
Contexto e acesso ao Mythos
O Mythos foi introduzido pela Anthropic em abril com acesso limitado a empresas e organizações participantes do Projeto Glasswing, iniciativa voltada à proteção de softwares e infraestruturas críticas. Na semana passada, a companhia ampliou o acesso ao sistema para centenas de organizações em 15 países.
Imagem: Divulgação
Além dos filtros aplicados no Fable, a Anthropic exige que profissionais de segurança se inscrevam no Cyber Verification Program; aprovados nesse programa têm menos bloqueios ao usar o Claude em atividades ligadas à segurança digital. A OpenAI mantém um programa similar chamado Trusted Access for Cyber.
As críticas sobre o caráter excessivo das restrições continuam circulando entre especialistas. A Anthropic não respondeu ao pedido de comentário da reportagem.
Com informações de Olhardigital

Gudyê GR6 é editor-chefe e especialista em tendências musicais e entretenimento na GR6, a maior produtora de funk do Brasil. Com anos de experiência no mercado fonográfico, Gudyê lidera a equipe de conteúdo trazendo as últimas notícias sobre música, cultura urbana. Autor do Post: Gudyê GR6