CIÊNCIA & TECNOLOGIA
Impressionante! Inteligência artificial cria um vídeo seu usando apenas uma foto e um texto
A inteligência artificial usada pela empresa israelense D-ID é realmente impressionante. Com apenas uma foto e um texto, ela é capaz de criar um vídeo da pessoa em questão falando o que foi escrito. O mais impressionante, porém, é que a ferramenta não leva mais do que alguns minutos nos casos mais complexos.
Por motivos óbvios, a empresa não menciona o termo deepfake em suas páginas oficiais. Esse termo está fortemente associado ao uso incorreto da tecnologia, tal como difamação e manipulação política.
Mas não é isso o que a D-ID tem em mente. Ela criou a ferramenta para fins legítimos, tais como gravação de treinamentos, campanhas de marketing, comunicados internos, etc.
Como funciona?
A ferramenta desenvolvida pela D-ID tem um uso super fácil e intuitivo. Literalmente qualquer pessoa consegue criar um vídeo por lá. O primeiro passo é acessar o site Creative Reality Studio. Na parte central do site você verá diversos apresentadores. Escolha o que você achar melhor. No lado direito há um campo para você digitar o texto que deve ser falado pelo apresentador.
Além de poder escolher diferentes rostos de apresentadores, você também pode escolher entre várias opções de vozes. Tanto masculinas quanto femininas. Há também várias opções de tom de voz, tais como raiva, triste, animado, amigável, esperançoso, gritando, sussurrando, dentre outras.
Para dar mais realismo, você pode fazer o upload de um arquivo de áudio com uma pessoa real lendo o texto. O idioma principal da ferramenta é o inglês americano, obviamente. Mas há suporte para outros 119 idiomas, dentre eles o português brasileiro.
E se eu não quiser usar nenhum dos apresentadores disponíveis na ferramenta. Você pode subir uma foto sua (ou de outra pessoa). Depois de tudo configurado, é só esperar a inteligência artificial fazer o seu trabalho e gerar o vídeo conforme você pediu. Por fim, é só baixar o vídeo e publicar onde você quiser.
Inteligência artificial cumpre muito bem o seu papel
A inteligência artificial da D-ID funciona muito bem para o que se propõe. O tempo de criação do vídeo varia de alguns segundos para alguns minutos. Tudo depende do tamanho do texto a ser lido, do idioma configurado e também do apresentador escolhido. Quanto mais curto for o texto, mais rápido a ferramenta gera o vídeo.
Porém, há algumas limitações. Por exemplo, no idioma inglês há várias opções de vozes femininas e masculinas. Mas no português brasileiro só há uma opção de cada gênero. Mas não se preocupe, a pronúncia é feita corretamente.
Além disso, é bem fácil perceber que se trata de um deepfake. A pessoa fica com um movimento muito robótico. A cabeça faz sempre os mesmos movimentos e nem sempre o movimento dos lábios coincide com a palavra que está sendo dita. Mas, no geral, o resultado é convincente e serve muito bem para usos legítimos.
Filtros contra usos maliciosos
Os desenvolvedores da ferramenta sabem que ela pode ser usada para fins maliciosos. Como já expliquei nos parágrafos anteriores, a prática de deepfake é usada para manipulação política ou para difamar pessoas públicas. Visando evitar esse tipo de uso da ferramenta, a D-ID implementou alguns filtros em sua inteligência artificial.
Por exemplo, não é possível subir textos que contenham palavrões ou expressões racistas. A inteligência artificial usa também uma API da Microsoft Azure que identifica e retira falas sexuais ou ofensivas de vídeos.
Também não é possível usar imagens de pessoas públicas. Então se você, por exemplo, tentar subir uma foto do Bill Gates, será barrado pela ferramenta. Todos esses filtros e limitações dificultam o uso da inteligência artificial para fins maliciosos.
De qualquer forma, a D-ID possui uma política contra uso indevido. No caso de descumprimento das regras, o usuário será punido com banimento definitivo da plataforma e também terá o conteúdo apagado.
Como eu faço para usar?
Qualquer pessoa pode testar a inteligência artificial da D-ID. basta criar uma conta no site Creative Reality Studio. A empresa oferece um plano gratuito, mas bem limitado. Na verdade, é um teste grátis de 14 dias. Durante esse tempo, você tem 20 créditos para gerar seus vídeos.
Cada crédito significa que você pode criar um vídeo de até 15 segundos. Portanto, no plano gratuito você consegue gerar até 5 minutos de vídeo. Mas vale ressaltar que nessa modalidade os vídeos gerados possuem marcas d’água por toda a imagem.
Caso queira pagar para usar, há dois planos. O primeiro custa US$ 49 por mês (cerca de R$ 250) e dá direito a 60 créditos (15 minutos de vídeo). Para uso ilimitado, porém, você deve optar pelo segundo plano, cujo valor é negociado diretamente com a D-ID.
Ao pagar um dos planos você tem a remoção da marca d’água, plugin para o Microsoft PowerPoint, suporte por e-mail e acesso a apresentadores com expressões faciais mais realistas.
Fonte: TechCrunch