A IA gerativa está a mudar o mundo: com apenas alguns comandos, os utilizadores podem criar apresentações, manipular vídeos e ter textos escritos. Saiba quais são as ferramentas de IA divertidas que o podem ajudar.

Por Heinrich Vaske
O sucesso do ChatGPT chamou a atenção para a inteligência artificial (IA), especialmente para a IA generativa. Apresentamos algumas ferramentas para as quais deve olhar – porque melhoram o seu trabalho diário ou simplesmente porque são fixes.
bHuman – vídeos personalizados à escala
Trabalha em marketing ou vendas e quer enviar vídeos personalizados em massa? A bHuman permite-lhe enviar vídeos pré-fabricados e incluir neles endereços e elementos individuais para que os destinatários se sintam pessoalmente atingidos. Pode utilizar modelos da indústria ou de funções específicas como base para isto, o que deverá interessar a clientes, parceiros ou outros consumidores. Ou pode dirigir-se à sua própria clientela no vídeo, e a IA permite-lhe inserir automaticamente os destinatários e endereçá-los individualmente na sua voz.
Isto torna possível envios personalizados em massa. Os modelos estão disponíveis para muitos tópicos: geração de leads, por exemplo, atendimento e apoio ao cliente ou finanças. Isto pode ser atrativo no comércio eletrónico, por exemplo, para contrariar cancelamentos de compras. O cliente contém então o seguinte vídeo pré-fabricado: “Cara Sra. Müller (o nome será inserido de forma personalizada), vi que preencheu o seu carrinho de compras, mas ainda não concluiu a compra…” Algo como isto também pode ser integrado numa suite de e-mail marketing, tabelas com nomes de clientes podem então ser armazenadas. Os utilizadores podem também pré-fabricar os vídeos e fazer com que a IA preencha o espaço em branco aonde os nomes pertencem. As vozes são indistinguíveis.
Browse AI – monitorizar sítios web
Este analisador de websites ajuda os utilizadores a monitorizar constantemente as alterações nos websites e a extrair conteúdo sem codificar ou escrever uma API. Por exemplo, com bots pré-construídos é possível obter informações de empresas ou listagens de empregos do LinkedIn, listagens de aplicações do Google Workspace marketplace, eventos online da Eventbrite, pesquisas específicas na Amazon, tendências Google específicas de países e muito mais.
O Browse AI é adequado para acompanhar constantemente a evolução de conteúdos e preços em websites. Websites que não oferecem uma API em si, ou que oferecem a API errada, não são um obstáculo: os utilizadores podem gerar rapidamente as suas próprias API para extração de dados, que podem ser utilizadas para rastrear o conteúdo desejado.
ChatGPT – envio de texto e programação sob comando
Não é preciso dizer muito mais sobre o chatbot da OpenAI, que foi apresentado em novembro de 2022. Pode escrever independentemente textos de vários tipos, criar códigos de programas e também pode ser útil para depurar códigos de software. Uma vez que o ChatGPT responde rápida, frequente e corretamente a perguntas simples, a Microsoft está a construir a ferramenta na sua pesquisa e em várias aplicações Office.
ClipDrop – o assistente de design inteligente
A ferramenta de IA ClipDrop descreve-se como um “assistente de desenho” que ajuda a melhorar a qualidade das imagens, otimizando a exposição, cor e qualidade e também removendo fundos, se necessário. Mas o ClipDrop pode fazer ainda mais: com apenas alguns cliques, objetos individuais, pessoas, textos ou defeitos podem ser eliminados das imagens. Há também uma opção “Substituir”: pessoas e objetos podem ser projetados em frente de novos fundos. O ClipDrop está também disponível como aplicação para iOS e Android.
Compose AI – a IA que responde a emails
Esta é uma extensão do navegador Chrome do Google que é suposto ajudar a responder aos e-mails mais rapidamente. O Compose AI também funciona de forma semelhante ao ChatGPT. No prompt “Tell Wolfgang I’m busy now but will reply next week”, a ferramenta compõe uma elaborada resposta de e-mail e até aprende o estilo de escrita do cliente ao longo do tempo.
DALL-E2 – pintura sob comando
Provavelmente já ouviu falar de DALL-E2. Diga à IA generativa qual a imagem a criar para si. Como é frequentemente o caso, depende da rapidez, ou seja, da precisão e plausibilidade das suas instruções. Com a DALL-E2 recebe todos os meses créditos gratuitos, que pode utilizar. Também pode carregar as suas próprias imagens e pedir à DALL-E para as modificar.
Describt Overdub – clona a sua voz
Um software de edição de áudio e vídeo que lhe permite copiar exatamente uma voz é o que faz o Descript Overdub. A funcionalidade de clonagem de voz realista é um pouco assustadora. Depois de uma tentativa, vai querer avisar imediatamente a sua avó sobre telefonemas duvidosos de netos em apuros a pedir dinheiro.
Os utilizadores podem treinar a IA com gravações que contenham pelo menos dez minutos, mas idealmente 30 a 180 minutos de língua falada. Quando o modelo estiver pronto, os utilizadores podem editar textos falados no ecrã antes de serem recitados com a sua própria voz ou com uma voz falsa. As palavras recém-adicionadas são integradas no texto falado de tal forma que os ouvintes não notam a diferença. A Describt oferece uma variedade de vozes profissionais que os utilizadores podem utilizar para que os seus vídeos pareçam mais profissionais.
D-ID.com – vídeos rapidamente
A plataforma de vídeo suportada por IA Creative Reality Studio da D-ID.com é adequada para produzir vídeos muito fácil e rapidamente. Aqui, os utilizadores podem escolher uma foto-realista ou um rosto ilustrado como o seu avatar. Também pode carregar a sua própria imagem (JPG, PNG – máximo 4,5 MB) e fazê-la falar (foto-para-vídeo). Basta escolher uma voz agradável e introduzir o texto que deseja que o seu avatar recite na barra lateral à direita.
A D-ID oferece-se também para criar um avatar usando a funcionalidade texto para imagem de Stable Diffusion. Os vídeos são fornecidos em formato MP4 e podem ter uma duração máxima de cinco minutos. Aqueles que utilizam a API paga de D-ID.com podem criar vídeos com até dez minutos de duração. Os textos podem ser carregados como ficheiro linguístico, introduzidos por escrito numa barra lateral ou criados automaticamente através de um editor GPT3. São suportados 119 idiomas. Os utilizadores recebem 20 créditos gratuitos (15 segundos cada) para jogar.
Durable – construir websites em 30 segundos
Com a ajuda da IA, simples websites com texto, imagens e formulários de contacto podem ser construídos em 30 segundos – é isso que a Durable promete. Os utilizadores entram no tipo de negócio em que estão interessados e o nome da empresa ou pessoa. Depois, a IA sugere um design de website com imagens, descrições e elementos correspondentes. A Durable oferece também um “Gerador de nomes comerciais” e um “Google Ad Writer” com o qual as mensagens publicitárias podem ser criadas automaticamente.
Kaiber – vídeos com um toque
Não são só textos e imagens, mas também vídeos e animações artísticas que podem ser criados com IA. Basta descrever brevemente a ideia e – opcionalmente – carregar uma imagem. O Kaiber converte a entrada em animações visuais. Os novos clientes recebem gratuitamente 50 créditos, que são suficientes para cinco vídeos. Estes são marcados com uma marca de água e não podem ser utilizados comercialmente. Caso contrário, os clientes têm de criar uma conta paga.
Midjourney – texto para imagem com qualidade
O Midjourney, atualmente ainda em beta, também cria imagens a partir de descrições de texto. O pré-requisito é que os utilizadores instalem a Discord, a aplicação gratuita de comunicação e chat conhecida do mundo dos jogos. Os trabalhos criados com Midjourney são frequentemente de alta qualidade e realistas. Em princípio, estão também à disposição de outros utilizadores para remixes. Se pretende direitos exclusivos sobre uma imagem, tem de pagar por ela.
O Midjourney já pode complementar ou substituir o trabalho de artistas gráficos e designers aqui e ali. Como sempre com a IA generativa, os estímulos são o desafio. Quanto mais precisos são, melhor o resultado. O Midourney exibe as melhores criações, incluindo as instruções de texto, no seu próprio website. As imagens da IA criadas não podem ser modificadas.
Notion AI – colaboração inteligente
Muitos utilizadores organizam os seus projetos e tarefas com a plataforma Notion workspace. Podem utilizá-la para criar documentos, gerir bases de dados, acompanhar o sucesso dos projetos e colaborar com outros. Com a Notion AI, os utilizadores recebem agora um assistente inteligente que os ajuda a escrever, editar, fazer brainstorming e resumir. Tal como o ChatGPT, o Notion AI assume o primeiro rascunho sobre um tópico, fornece listas com ideias sobre certos aspetos, verifica textos para expressão e gramática, traduz e resume textos longos.
Pictory – tudo para edição de vídeo
A edição de vídeo baseada em IA é tornada possível pelo Pictory. A ferramenta ajuda a processar rapidamente os vídeos pós-processados, incluindo o corte de sequências indesejadas ou o encurtamento. Trailers curtos podem ser gerados a partir de vídeos longos com o toque de um botão, que captam os pontos altos do vídeo. Com a tecnologia “ReelFast”, os guiões ou posts de blogues também podem ser convertidos em vídeos. E, finalmente, os textos também podem ser automaticamente inseridos em vídeos – traduzidos, se necessário. O Pictory torna tudo isto possível sem a necessidade de conhecimentos técnicos.
Rewind.ai – olhar para trás, apenas no Mac
O Rewind anuncia-se como um “motor de busca para a sua vida”, mas isto só se aplica aos utilizadores de Apple Mac. Tudo o que os utilizadores fazem no seu computador é gravado no Mac ou num disco rígido externo: vídeos consumidos, páginas web visitadas, conteúdo produzido internamente. Tudo isto pode ser rastreado numa linha temporal. Os utilizadores podem verificar em qualquer altura o que estavam a fazer, por exemplo, há três semanas a uma determinada hora.
O Rewind utiliza MacAPIs e OCR nativos para analisar o conteúdo do ecrã. Reuniões em Zoom ou Teams são também preservadas conforme necessário. Para o fazer, a ferramenta utiliza uma técnica de compressão particularmente poderosa, baseada em IA. Os dados registados são comprimidos por um fator de 3.750. Isto permite aos utilizadores armazenar anos de história do computador num disco rígido médio.
Runway – manipulação de vídeo facilitada
Preocupações com falsificações profundas são entendidas por todos, ou quando tiverem dado uma vista de olhos à Runway. A empresa oferece uma vasta gama de soluções de IA, mas está atualmente a chamar a atenção com uma ferramenta de próxima geração para a edição de vídeo. Com a Runway, os vídeos existentes podem ser transformados em novos, substituindo elementos renderizados pelas suas próprias imagens ou manipulando-os.
A empresa está prestes a lançar o novo modelo Gen-1 de IA generativa, que deverá levar a síntese de vídeo a um nível ainda mais elevado com a ajuda de modelos de difusão. Os utilizadores podem manipular vídeos ao seu gosto e em vários modos.
Stable Diffusion- texto para imagem no próprio PC
Um gerador de texto para imagem baseado em deep leraning é o que faz o Stable Diffusion. Tal como no DALL-E e Midjourney, as imagens são geradas com base em descrições de texto, mas enquanto estes modelos proprietários só são acessíveis através da cloud, no Stable Diffusion o código e modelos disponíveis gratuitamente podem ser executados em hardware de consumo. O pré-requisito é uma GPU com pelo menos 8 GB de memória gráfica. A diferença para os concorrentes é, entre outras coisas, que o Stable Diffusion é muito mais barato, mais permissivo com imagens de formação de celebridades e conteúdo explícito. Além disso, as imagens são oferecidas numa resolução mais alta (1024×1024 pixels), as imagens DALL-E são apenas metade da resolução.
Synthesia – produção rápida de vídeo para profissionais
Qualquer pessoa que queira criar vídeos simples rapidamente, por exemplo para explicar alguma coisa, pode selecionar um dos 65 avatares no website pago Synthesia, introduzir um texto escrito – e o avatar balbucia à distância. Por 1.000 dólares por ano, os utilizadores podem até ter o seu próprio avatar personalizado construído com a sua cara, que pode ser criado e treinado em dez a 15 minutos.
O Synthesia é adequado para apresentações em formato de vídeo, uma vez que imagens (Shutterstock), gráficos, música de fundo e vídeos MP4 também podem ser integrados. Outra vantagem da ferramenta é o seu multilinguismo. As taxas de licença começam em 26 dólares por pessoa por mês.
Tome – apresentação com um toque de botão
Está cansado, mas precisa de criar uma apresentação rapidamente? Deixe o trabalho a cargo do Tome! Escolha um modelo, introduza os seus requisitos (prompt) com a maior precisão possível, e como que por magia a sua apresentação é criada no ecrã (atualmente apenas em inglês).
Para a criação de texto a ferramenta utiliza o ChatGPT e para ilustração o DALL-E 2 – ambos da OpenAI. Após o processo de produção, pode ainda rever a sua apresentação individualmente com ferramentas de edição, se assim o desejar. Em qualquer caso, o Tome.ai pode conceber uma apresentação básica e poupar-lhe muito trabalho.
VALL-E – clone de vozes em três segundos
O modelo AI VALL-E da Microsoft – nome sem dúvida emprestado do produto OpenAI DALL-E – é caracterizado pela sua capacidade de imitar vozes. O que há de especial nele: o VALL-E necessita apenas de uma amostra de alguns segundos como modelo de treino. A ferramenta foi treinada com 60.000 horas de dados de voz em inglês. A voz AI é também capaz de imitar o tom de voz e as emoções de um orador. O VALL-E ainda não está disponível ao público, e a qualidade dos resultados varia, dependendo da quantidade de dados de formação.