Os nossos desejos são ordens para a nova legião de robôs da Google

A empresa americana desenvolveu tecnologia inovadora de inteligência artificial com o objetivo de fazer com que os seus robôs respondam de forma mais eficiente aos pedidos humanos.

Por Irene Iglesias Álvarez

A empresa mãe da Google, Alphabet, combinou a compreensão da linguagem da inteligência artificial (IA) e da robótica para trazer ‘vida’ a um robô capaz de compreender os comandos humanos. Uma tarefa em que se têm concentrado desde cerca de 2019 com o objetivo de desenvolver robôs que possam realizar tarefas quotidianas. Agora, o seu objetivo mais recente é ajudar as pessoas a comunicar melhor com os robôs através de voz ou texto e permitir-lhes executar tarefas complexas com uma melhor compreensão da linguagem natural.

Um projeto promovido pela empresa Everyday Robots em conjunto com a Google Research. Neste momento, embora a iniciativa esteja ainda na sua infância, os robôs já passaram pela última atualização baseada numa melhor compreensão da linguagem, graças ao modelo de linguagem grande (LLM) da Google PaLM. “Esta é a primeira implementação que utiliza um modelo de linguagem de grande escala para planear um verdadeiro robô. O novo projeto deverá ajudar as pessoas a comunicar melhor com os robôs”, explica a Google a partir dos seus escritórios, em Mountain View.

Robótica útil

Graças a esta nova implementação, os nossos desejos podem tornar-se comandos para os robôs num futuro próximo. A Google demonstrou isto numa conferência de imprensa no seu laboratório de robótica na Califórnia, EUA. Aí, mostrou aos presentes a combinação dos elementos da robótica física com as capacidades e a compreensão dos chatbots virtuais. Também o fez utilizando um destes robôs como empregado de mesa, para procurar todos os tipos de alimentos e oferecê-los aos engenheiros da empresa. Assim, embora o robô não possa realizar mais do que uma dúzia de ações simples, abre a porta a um novo passo na direção certa em termos de inteligência artificial para dar aos robôs multiusos uma nova utilidade.

Vale a pena notar que, de acordo com um relatório publicado na Wired, a demonstração responde à forma como estes robôs precisam de reagir a um comando sem lhes dar mais instruções. A chave é que ao fazer os comandos relevantes para que estes robôs executassem as suas tarefas, nenhum código foi programado para saber o que fazer em resposta aos comandos dos engenheiros. O software de controlo dos robôs tinha aprendido a traduzir uma frase dita por uma pessoa numa sequência de ações físicas para levar a cabo a tarefa.

O que a Google está a tentar alcançar não é apenas reduzir a interação com estes robôs ao mínimo necessário para a realização de tarefas complexas, mas também tornar possível a interação com humanos em ambientes complexos. Para tal, dizem os investigadores, têm alimentado grandes quantidades de texto de documentos físicos e digitais em modelos específicos de aprendizagem mecânica. Mas, de momento, é claro, isto vem com limitações. Apesar do poder do PaLM, não se sabe se o sistema seria capaz de compreender fluentemente frases ou comandos muito fluidos, ao contrário de como o faz com comandos simples. De acordo com Brian Ichter, um cientista investigador da Google, este projeto poderia conduzir a métodos para a construção de modelos linguísticos com uma melhor compreensão da realidade.




Deixe um comentário

O seu email não será publicado