Na terça-feira, a Anthropic lançou o Fable, apresentado como uma versão pública e com recursos limitados do Mythos, seu sistema voltado à segurança digital. O lançamento gerou reclamações entre pesquisadores e profissionais de cibersegurança, que dizem que os mecanismos de bloqueio do modelo impedem até atividades consideradas inofensivas.

O que o Fable bloqueia

De acordo com relatos publicados em redes sociais e fóruns especializados e compilados pelo TechCrunch, o Fable interrompe conversas sempre que seus filtros internos detectam temas relacionados à cibersegurança ou biologia. Nessas situações, a ferramenta exibe uma mensagem informando que “medidas de segurança sinalizaram esta mensagem por tópicos de cibersegurança ou biologia” e, automaticamente, retorna ao Claude Opus 4.8.

A Anthropic justifica os bloqueios afirmando que os filtros visam impedir usos maliciosos, como criação de malware ou invasão de sistemas. A empresa também aplica restrições a solicitações ligadas à biologia por receio de uso indevido envolvendo armas biológicas.

Reações de especialistas

Pesquisadores relataram casos em que pedidos simples foram barrados. Valentina “Chompie” Palmiotti, pesquisadora da IBM X-Force, afirmou que o Fable rejeita qualquer solicitação que tenha relação, ainda que tangencial, com cibersegurança — inclusive tarefas como ler uma postagem de blog. Outro pesquisador declarou na plataforma X que pedir uma revisão de código já aciona as barreiras da plataforma.

Matt Suiche, da equipe técnica da Tolmo, startup de segurança digital com IA, disse ao TechCrunch que o sistema tende a classificar pedidos de boas práticas de programação como trabalho de cibersegurança e aplicar restrições. Ele avaliou que os bloqueios parecem baseados em palavras-chave, o que faria com que termos do campo lexical de “cibersegurança” disparassem as limitações. Suiche também declarou compreender a postura preventiva da Anthropic, destacando que restrições mais rígidas no início do lançamento podem ser flexibilizadas com o tempo e com colaboração entre as empresas do setor.

Contexto e acesso ao Mythos

O Mythos foi introduzido pela Anthropic em abril com acesso limitado a empresas e organizações participantes do Projeto Glasswing, iniciativa voltada à proteção de softwares e infraestruturas críticas. Na semana passada, a companhia ampliou o acesso ao sistema para centenas de organizações em 15 países.

IA pública da Anthropic, Fable, sofre críticas por bloquear até tarefas básicas de cibersegurança

Imagem: Divulgação

Além dos filtros aplicados no Fable, a Anthropic exige que profissionais de segurança se inscrevam no Cyber Verification Program; aprovados nesse programa têm menos bloqueios ao usar o Claude em atividades ligadas à segurança digital. A OpenAI mantém um programa similar chamado Trusted Access for Cyber.

As críticas sobre o caráter excessivo das restrições continuam circulando entre especialistas. A Anthropic não respondeu ao pedido de comentário da reportagem.

Com informações de Olhardigital