O futuro da realidade aumentada é a IA

E o futuro da IA é… a realidade aumentada.

Por Mike Elgan

A OpenAI anunciou recentemente novas e poderosas capacidades do ChatGPT, incluindo a possibilidade de utilizar imagens para além de mensagens de texto em conversas com o chatbot de IA.

A empresa deu exemplos:

“Tire uma fotografia de um ponto de referência enquanto viaja e tenha uma conversa em direto sobre o que é interessante nesse ponto. Quando estiver em casa, tire fotografias do frigorífico e da despensa para descobrir o que há para o jantar (e faça perguntas de acompanhamento para obter uma receita passo a passo). Depois do jantar, ajude o seu filho com um problema de matemática tirando uma fotografia, fazendo um círculo à volta do conjunto de problemas e pedindo-lhe que partilhe dicas com ambos.”

[ O metaverso: ainda não morreu ]

(A empresa também anunciou que a sua aplicação móvel suportaria a entrada e saída de voz para o chatbot. Poderá falar com o ChatGPT, tal como dezenas de aplicações de terceiros já o permitem. E os responsáveis da OpenAI também anunciaram que o ChatGPT poderá em breve aceder ao motor de busca Bing da Microsoft para obter informações adicionais).

A OpenAI não é a única empresa de IA a prometer mensagens com imagens.

Os novos óculos com câmara da Meta

A Meta, a empresa anteriormente conhecida como Facebook, revelou recentemente a segunda versão dos seus óculos com câmara, criados numa parceria com a divisão Ray-Ban da EssilorLuxottica. Os novos óculos, que custam 299 dólares e estarão disponíveis a 17 de outubro, possuem mais e melhores câmaras, microfones e altifalantes do que a primeira versão – e permitem a transmissão em direto para o Facebook e o Instagram.

Os nerds dos gadgets e os influenciadores sociais estão entusiasmados com estas funcionalidades. Mas a verdadeira atualização é a inteligência artificial (IA). Os óculos contêm o novo e poderoso chip AR1 Gen 1 da Qualcomm, o que significa que os utilizadores que usam os óculos inteligentes Meta Ray-Ban podem conversar com a IA através dos altifalantes e microfones incorporados. Mas esta não é uma IA qualquer.

Num anúncio relacionado, a Meta anunciou uma alternativa ao ChatGPT chamada Meta AI que também suporta conversação por voz, com as respostas faladas por qualquer uma das 28 vozes sintéticas disponíveis. A Meta tem vindo a integrar a Meta AI em todas as suas plataformas sociais (incluindo os óculos) – e a Meta AI poderá também pesquisar no motor de busca Bing da Microsoft informações mais atualizadas do que aquelas em que o Llama LLM (Large Language Model) foi treinado.

O Facebook prometeu uma atualização de software no próximo ano que tornará os óculos Meta Ray-ban “multimodais”. Em vez de interagir com o chatbot Meta AI através da voz, os óculos passarão a poder aceitar “pedidos de imagens”, tal como o OpenAI faz atualmente. Mas, em vez de carregar uma imagem, os óculos Meta Ray-Ban vão simplesmente capturar a imagem utilizando as câmaras incorporadas nos óculos.

Ao usar os óculos, será possível olhar para um edifício e dizer: “Que edifício é este?” e a IA dá-lhe a resposta. A Meta também prometeu tradução linguística em tempo real de sinais e menus, instruções sobre como reparar o eletrodoméstico para o qual se está a olhar e outras utilizações. Espero que seja apenas uma questão de tempo até que os óculos nos digam com quem estamos a falar através da poderosa tecnologia de reconhecimento facial da Meta.

Por outras palavras, os Meta Ray-Bans tornar-se-ão efetivamente óculos de RA com essa atualização de software.

Porque é que o futuro da RA é a IA

A realidade aumentada (RA) é uma tecnologia que melhora ou fornece informações adicionais sobre o que vemos na realidade física através de imagens digitais, sons e texto.

Empresas como a Apple, a Microsoft e a Magic Leap passaram décadas (e milhares de milhões de dólares) a inventar sistemas para mostrar objetos, personagens e avatares virtuais em 3D de alta resolução aos utilizadores dos seus óculos de RA caros, pesados e que consomem muita bateria.

Sempre que nós, nos meios tecnológicos ou na indústria tecnológica, pensamos ou falamos de RA, tendemos a concentrar-nos no tipo de imagens holográficas que podemos ver sobrepostas no mundo real através dos nossos óculos de RA. Imaginamos o Pokémon Go sem mãos ou versões radicalmente melhores do Google Glass.

Mas desde que a revolução dos chatbots generativos baseados em IA/LLM surgiu no final do ano passado, tornou-se cada vez mais claro que, de todas as peças que compõem uma experiência de RA, os objetos virtuais digitais holográficos são os menos importantes.

Os óculos são necessários. Os telemóveis Android e os iPhones têm capacidades de “realidade aumentada” há anos e ninguém se importa, porque olhar para o telemóvel não se compara a ver o mundo de mãos livres através de óculos.

As câmaras e outros sensores são necessários. É impossível aumentar a realidade se o dispositivo não tiver uma forma de a percecionar.

A IA é necessária. Precisamos da IA para interpretar e dar sentido a pessoas, objetos e atividades arbitrárias nos nossos campos de visão.

O áudio bidirecional é necessário. O utilizador precisa de uma forma mãos-livres para consultar e interagir com o software, a fim de exercer controlo sobre a RA.

E, ao que parece, o ecrã virtual, os dados virtuais e os objetos virtuais, embora sejam agradáveis de ter, não são necessários.

A tecnologia que pensávamos ser a mais importante acaba por ser a menos importante. Demos demasiada importância à qualidade visual do “resultado” quando falamos de RA. Os participantes em conferências, as audiências de demonstração e os primeiros clientes ficaram deslumbrados com personagens 3D a saltar e outras partes inúteis de conteúdo.

E a qualidade do conteúdo e a sua relação com a realidade que está a ser aumentada? O que torna a RA realmente poderosa é o facto de os nossos dispositivos começarem com uma compreensão clara do que está à nossa frente e, depois, poderem dar-nos informações, conhecimentos e conselhos sobre essa realidade.

Tornou-se claro que a IA é a componente mais indispensável da RA para fins gerais.

Isto é o oposto da realidade virtual, em que os visuais são tudo e a IA nem sequer é necessária.

Zuckerberg disse no anúncio da Meta Ray-Ban que “os óculos inteligentes são o formato ideal para permitir que os assistentes de IA vejam o que estamos a ver e ouçam o que estamos a ouvir”.

E tem razão.

Não é de todo claro que o Meta vá dominar o futuro da RA. Mas o que é claro é que a IA é o futuro da RA, e a RA é o futuro da IA. Não me surpreenderia se todas as principais empresas de IA, incluindo a OpenAI, a Microsoft e a Google, lançassem rapidamente óculos do tipo Meta Ray-Ban. Porque falar é melhor do que escrever, e mostrar é melhor do que falar.

As fugas de informação, as patentes e os relatórios sobre a Apple sugerem que a empresa está a trabalhar em óculos de realidade aumentada leves e de uso diário, que serão lançados anos mais tarde, muito depois do lançamento do Vision Pro, enorme e volumoso, para uso interno. Mas parece-me que a Apple vai voltar a perder o barco, tal como aconteceu com o assistente virtual doméstico Amazon Echo. A Apple levou mais de dois anos para lançar o Apple HomePod depois que a Amazon lançou o Echo. O que está a atrasar os óculos para todo o dia da Apple é o facto de estar empenhada em apresentar ao utilizador dados visuais atraentes nas lentes, em vez de se concentrar nas conversas por voz e na entrada da câmara de IA.

Parece que ninguém está a registar totalmente as implicações dos anúncios da semana passada, por isso vou dizê-lo abertamente: O anúncio dos óculos inteligentes Meta Ray-Ban significa que a corrida para dominar a nova plataforma de óculos de realidade aumentada orientados para a IA está realmente a decorrer. Esta é uma plataforma de computação totalmente nova que vai ser enorme tanto para os consumidores como para as empresas. Volto a repetir: O futuro da RA é a IA. E o futuro da IA é a RA.




Deixe um comentário

O seu email não será publicado