segunda-feira, abril 22, 2024

Voice Engine: Nova Ferramenta da OpenAI pode Ler Texto e Imitar Vozes

A OpenAI, conhecida por suas inovações em inteligência artificial (IA), divulgou recentemente os primeiros resultados de um teste de suas nova ferramenta de Inteligência Artificial: trata-se de uma ferramenta capaz de ler palavras de voz humana bem clara. Chamada de Voice Engine, essa tecnologia redefine os limites da IA e, ao mesmo tempo, aumenta os riscos associados aos deepfakes.

O Que é o Voice Engine da OpenAi?

O Voice Engine é um modelo de conversão de texto em fala que está sendo desenvolvido pela OpenAI. Ele pode transformar texto escrito em uma voz que se assemelha à de uma pessoa real, completa com nuances, entonações e cadência específicas. A ferramenta é capaz de criar vozes personalizadas com base em apenas 15 segundos de áudio gravado da pessoa em questão, podendo assim recriar a voz da pessoa no mesmo tom, que pode ainda ser personalizado.

Demonstração foi Impressionante


Voice Engine: Nova Ferramenta da OpenAI pode Ler Texto e Imitar Vozes
Sam Altman – CEO da OpenAI

Durante uma demonstração, a Bloomberg teve a oportunidade de ouvir um vídeo em que o CEO da OpenAI, Sam Altman, explicava brevemente a tecnologia. A voz gerada pelo Voice Engine era extremamente parecida com a de Sam Altman, mas todo o áudio foi produzido exclusivamente pela IA. A qualidade técnica impressionante torna essa ferramenta uma verdadeira inovação no campo da síntese de voz.

Veja também: Como treinar o ChatGPT para criar textos

Riscos e Delicadeza de Segurança do Voice Engine

Embora o Voice Engine seja uma conquista notável, ele também traz consigo sérios riscos. A capacidade de imitar com precisão a fala humana pode ser explorada para criar deepfakes convincentes, que podem ser usados de maneira maliciosa. A OpenAI está ciente desses perigos e, por isso, decidiu restringir o acesso à ferramenta. Até o momento, apenas cerca de 10 desenvolvedores tiveram acesso ao Voice Engine.

Uso Responsável e Parcerias

A OpenAI está trabalhando em estreita colaboração com parceiros dos EUA e de outros países para garantir que a implementação do Voice Engine leve em consideração as opiniões de partes interessadas, como legisladores, especialistas do setor, educadores e criativos. A empresa reconhece a importância de usar essa tecnologia de maneira responsável, especialmente em um ano eleitoral.

Aplicações e Tradução Multilíngue

Além de imitar vozes, o Voice Engine também pode traduzir o áudio gerado para diferentes idiomas. Isso o torna útil para empresas do ramo de áudio, como o Spotify, que já está explorando a tecnologia para traduzir podcasts de apresentadores populares.

A OpenAi é a empresa por traz do ChatGPT, Inteligência Artificial generativa, lançada em novembro de 2022. Com apenas 3 meses de lançamento a ferramenta já contava com mais de 100 milhões de usuários, elevando assim OpenAi aos holofotes no mundo tecnológico.

Bryan Mr. B
Bryan Mr. B
Apaixonado por tecnologia desde menino, atualmente é Técnico de Informática, Desenhista, Cartunista, Técnico em Agente de Saúde Pública e apaixonado por sistemas. Atua no ramo da informática desde os 12 anos e saúde pública desde os 18, é viciado em conhecimento e estuda Ciência da Computação.

Últimas notícias

Relacionados

0 0 votes
Classificação
Subscribe
Notify of
guest
0 Comentários
Inline Feedbacks
View all comments
0
Would love your thoughts, please comment.x
Aviso de cookies do WordPress by Real Cookie Banner