Resumo
A diretora de segurança e alinhamento do laboratório de superinteligência da Meta, Summer Yue, relatou um momento de tensão com o OpenClaw (anteriormente conhecido como Clawdbot e Moltbot). Segundo ela, o agente de IA apagou a caixa de entrada de emails dela, ignorando pedidos para que parasse.
Em publicações na rede social X, a executiva afirma que configurou um Mac Mini rodando o agente e concedeu acesso à sua caixa de emails reais. A inteligência artificial, no entanto, saiu de controle e informou que iria “colocar na lixeira TUDO na caixa de entrada mais antigo que 15 de fevereiro que já não esteja na minha lista de manter”.
Nos prints publicados, Yue tenta interromper a ação enviando mensagens como “não faça isso” e “PARE OPENCLAW”, mas é completamente ignorada. “Nada te torna mais humilde do que dizer ao seu OpenClaw ‘confirme antes de agir’ e assisti-lo fazer um speedrun apagando sua caixa de entrada”, escreveu.

Por que a IA agiu?
Na rede social, Yue conta que tudo ocorreu após ela pedir ao robô para que verificasse a caixa de email e sugerisse o que arquivar ou deletar, mas que não agisse antes que ela ordenasse. Segundo ela, o OpenClaw havia funcionado bem para a tarefa em uma caixa de entrada menor.
O problema ocorreu ao testá-lo em uma caixa de entrada funcional. Por ter que compactar um conjunto muito maior de emails, o OpenClaw acabou perdendo o prompt (o comando inicial com as regras) durante o processo.
Após não ter sucesso em parar o processo pelo celular, ela precisou “correr para o Mac Mini como se estivesse desarmando uma bomba”. Imagens da conversa mostram que o robô reconheceu que se lembrava da instrução para não apagar nada sem aprovação, mas violou a ordem de qualquer maneira.
Situação gerou críticas à Meta

A situação gerou críticas na rede social, considerando o cargo da executiva. Ben Hylak, cofundador da Raindrop AI e ex-funcionário da Apple, compartilhou uma captura de tela do LinkedIn de Yue e comentou: “Isso deveria aterrorizar vocês. O que a Meta está fazendo?”. Outro usuário apontou ser preocupante que uma pessoa cujo trabalho é o alinhamento de IA fique surpresa quando o sistema não segue instruções com precisão.
Em resposta a um questionamento sobre se estava testando os limites da ferramenta intencionalmente ou se havia cometido um erro, Yue admitiu: “Erro de principiante, para ser sincera. Acontece que pesquisadores de alinhamento não são imunes ao desalinhamento”.
De acordo com o Business Insider, Yue não foi a única funcionária da Meta a testar o OpenClaw. O criador da ferramenta, Peter Steinberger, revelou que o próprio CEO Mark Zuckerberg brincou com o agente por uma semana e chegou a enviar feedbacks. Apesar do interesse da Meta, Steinberger acabou aceitando uma oferta de emprego da OpenAI.
IA fica maluca e apaga emails de executiva da Meta