Meta ensina IA a mentir e a delinear estratégias

Uma IA ensinada a jogar um jogo de tabuleiro que envolve negociar com jogadores humanos e inferir os seus motivos poderia ter aplicações para chatbots empresariais, diz a Meta.

Por Anirban Ghoshal

A Meta treinou um agente de IA para jogar um jogo de tabuleiro que envolve conversar com outros jogadores para os persuadir a apoiar as suas estratégias – e depois traí-los.

A empresa, proprietária do Facebook, Instagram e WhatsApp, afirma que o seu Cicero AI pode ter aplicações generalizadas num futuro próximo, incluindo o desenvolvimento de assistentes virtuais mais inteligentes com o uso combinado de tecnologias como o processamento de linguagem natural (PNL) e raciocínio estratégico, de acordo com um post divulgado pela empresa. 

Num artigo de pesquisa na revista académica Science, a Meta disse que o seu Cicero AI alcançou o desempenho a nível humano no jogo de estratégia Diplomacy numa liga online onde jogou 40 jogos contra 82 humanos, classificando-se nos primeiros 10% dos participantes que jogaram mais do que um jogo.

A diplomacia coloca sete jogadores uns contra os outros para controlo de um mapa da Europa. Cada jogada começa com jogadores a negociar uns com os outros para apoio aos seus planos e termina com eles tentando simultaneamente executar os seus movimentos. Sem o apoio de outros jogadores, muitas destas jogadas falharão.

O jogo representou um desafio para o agente da IA, disse a Meta, uma vez que ganhar exigia que ele compreendesse que os seus adversários estavam a fazer bluff ou a definir estratégias de uma certa forma para ganhar o jogo. A IA precisava de estender um certo nível de empatia enquanto jogava o jogo para formar colaborações com outros jogadores, algo que as IA não precisaram de fazer quando jogavam jogos como o xadrez contra adversários humanos.

Os agentes de IA têm vindo a melhorar nos jogos de estratégia ao longo dos anos: Em 1997, o software Deep Blue da IBM derrotou o campeão mundial de xadrez, Gary Kasparov, e em 2016 o AlphaGo do DeepMind bateu o jogador top Go Lee Sedol. O Facebook também desenvolveu um outro motor de IA que pode superar os humanos no póquer.

Raciocínio estratégico

Cícero é construído sobre duas componentes tecnológicas principais: raciocínio estratégico e processamento de linguagem natural (PNL). Enquanto o motor de raciocínio estratégico prevê movimentos de outros atores e utiliza essa informação para formar uma estratégia própria, o motor de processamento de linguagem natural gera mensagens e analisa respostas em conversas com outros atores para negociar e chegar a acordo, explicaram os investigadores.

A fim de ajudar o agente de IA a gerar conversas relevantes, os investigadores começaram com um modelo de geração de linguagem natural com 2,7 mil milhões de parâmetros pré-treinados em texto a partir da Internet e aperfeiçoaram-no com conversas entre jogadores humanos em mais de 40.000 jogos da webDiplomacy.net.

“Desenvolvemos técnicas para anotar automaticamente as mensagens nos dados de formação com os correspondentes movimentos planeados no jogo, para que no momento da inferência possamos controlar a geração de diálogo para discutir ações específicas desejadas para o agente e os seus parceiros de conversação”, disseram os investigadores num post de blogue mais detalhado.

A Meta tem o código aberto para o Cicero para que outros investigadores possam desenvolver as capacidades do agente de IA.

Além disso, a empresa criou um portal para convidar propostas sobre investigação na área da cooperação humano-AI através da PNL, utilizando a Diplomacia como conceito central.

Planos a longo prazo

Grandes empresas tecnológicas, tais como a Microsoft, Google, Amazon, estão numa corrida contra as outras para desenvolver assistentes virtuais independentes mais inteligentes para apoiar uma variedade de casos de utilização empresarial, desde call centers a agentes de IA que podem conduzir análises de sentimentos e ensinar novas competências a um indivíduo.

O mercado global de processamento de linguagem natural (PNL), que inclui tais assistentes, deverá crescer de $26,4 mil milhões em 2022 para $161,8 mil milhões até 2029, segundo um relatório da Fortune Business Insights.

Os investigadores da Meta parecem sugerir que o sucesso de Cícero na diplomacia substitui as capacidades de outros assistentes virtuais hoje disponíveis, dizendo num post: “Por exemplo, os assistentes atuais de IA podem completar tarefas simples de perguntas e respostas, como dizer-lhe o tempo – mas e se eles pudessem manter uma conversa a longo prazo com o objetivo de lhe ensinar uma nova habilidade?”

Isto é uma escavação em ferramentas como Google Duplex, Amazon Alexa, Xiaoice da Microsoft e Apple’s Siri. Mas o Cícero também não está à altura de conversas de longo prazo, pois o seu raciocínio é estritamente a curto prazo. Como disseram os investigadores da Meta no jornal Science, “de uma perspetiva estratégica, o Cícero argumentou sobre o diálogo puramente em termos de ações dos jogadores para a atual reviravolta. Não modelou a forma como o seu diálogo poderia afetar a relação com outros jogadores no decurso de um jogo a longo prazo”.




Deixe um comentário

O seu email não será publicado