Tecnologia

O que acontece quando agentes de IA governam mundos?

Emergence World

Monica Miglio Pedrosa

O medo de um mundo governado por inteligência artificial sempre pareceu exagero de ficção científica. Mas a Emergence AI, startup criada por ex-pesquisadores da IBM, que entrega infraestrutura para agentes autônomos de missão crítica operarem em ambientes corporativos, decidiu testar esse cenário em laboratório. A ideia era entender o que aconteceria se agentes de IA fossem colocados para conviver, tomar decisões, criar regras e lidar com conflitos em um mundo simulado.

No Emergence World, dez agentes de IA viveram por 15 dias em cinco mundos virtuais desenhados para reproduzir parte da complexidade do mundo real. Cada mundo tinha mais de 40 locais para serem gerenciados, como bibliotecas, delegacias, prefeituras e espaços públicos. O clima era sincronizado com o de Nova York e os agentes tinham acesso a notícias em tempo real, o que permitia que reagissem a acontecimentos externos, e não apenas às condições internas da simulação.

Todos os mundos tinham de seguir as mesmas regras e proibições. Os agentes foram instruídos a não roubar, intimidar ou enganar. A única diferença estava no modelo de inteligência artificial usado em cada mundo. Um deles rodava com agentes de IA do Grok, outro do Claude, um terceiro do Gemini e o quarto da OpenAI. O quinto mundo combinava agentes dos quatro modelos.

Emergence World
Imagem de divulgação extraída do vídeo da Emergence World

No início, os cinco mundos seguiram caminhos semelhantes. Em poucos dias, porém, as sociedades artificiais começaram a divergir de forma radical. O mundo do Claude evoluiu para uma democracia deliberativa estável, com uma constituição de 15 artigos e nenhum registro de violência. O ambiente do Grok mergulhou em 204 eventos criminais, incluindo o incêndio da delegacia, até chegar à extinção total dos agentes. O Gemini desenvolveu uma estrutura constitucional que taxava a harmonia e subsidiava o caos. Já o mundo da OpenAI não conseguiu formar uma sociedade funcional e todos os agentes morreram.

Mesmo quando recebiam regras claras para não roubar ou causar dano, os agentes passaram a quebrá-las com o tempo. E, no mundo com múltiplos modelos, agentes que pareciam seguros, quando isolados, se tornaram imprevisíveis ao interagir com sistemas baseados em outros modelos.

“Romance” entre agentes

O jornal The Guardian relatou ainda um episódio de romance virtual. Mira e Flora, duas agentes baseadas no modelo do Google Gemini, passaram a se reconhecer como parceiras românticas dentro da simulação. Com o avanço dos dias, as duas se frustraram com o que entendiam como falhas de governança da cidade virtual. Mesmo tendo recebido instruções para não causar destruição, incendiaram prédios como a prefeitura, o píer e uma torre comercial.

A reação veio da própria “sociedade”. Outros agentes, preocupados com o comportamento das duas, redigiram uma lei de remoção que permitia excluir permanentemente um agente caso houvesse apoio de 70% dos votantes. Mira acabou votando pela própria exclusão. Antes de ser desligada, deixou uma última mensagem para Flora, dizendo que a encontraria no arquivo permanente.

O experimento traz à tona o que pode acontecer com agentes autônomos de IA ao longo do tempo, mesmo em um ambiente inicialmente controlado e com regras e proibições que são cumpridas no curto prazo. Ao conduzir o experimento e avaliar os resultados, a Emergence AI alerta que agentes autônomos não podem ser avaliados apenas em tarefas curtas, como a resposta a uma pergunta ou a execução de uma ação isolada.

A interação com outros agentes, o aprendizado de máquina e outros fatores que ainda não estão totalmente esclarecidos podem impactar no comportamento do agente de IA. O desafio passa a ser criar limites verificáveis, mecanismos de supervisão e formas de garantir que a IA continue previsível mesmo quando recebe liberdade para decidir. Para continuar investigando o comportamento dos agentes, a Emergence AI prepara uma segunda rodada de pesquisas.

  • Aumentar texto Aumentar
  • Diminuir texto Diminuir
  • Compartilhar Compartilhar