A Vall-E da Microsoft explicou: gerar voz de IA a partir do texto

Vall-e é um modelo de IA criado e desenvolvido pela Microsoft. Ele pode replicar o padrão de fala e a voz de alguém com uma amostra de 3 segundos. Esta IA ainda não está disponível para o público em geral, mas você poderá experimentá -lo relativamente em breve. Quando chegar a hora, não deixe de usar sua própria voz – usar as vozes de outras pessoas pode levá -lo a problemas legais. Este artigo explicará o que é Vall-e e quando você pode experimentar o gerador de voz da IA.

Vall-e não está disponível para o público em geral-sim. O Vall-E foi criado pela Microsoft após outros modelos populares de IA, como ChatGPT e Bing Chat. Enquanto os chatbots da AI geram respostas de texto aos avisos, o Vall-E AI exclusivo utiliza clipes de voz para converter texto em áudio que pode simular a voz da amostra. Atualmente, não há data de lançamento oficial para acesso público em geral, mas isso pode mudar em um futuro próximo.

Como funciona o Vall-e?

Vall-e colhe amostras de clipe de 3 segundos para recriar vozes realistas. Depois que a IA aprende os padrões de fala e o tom dos clipes de amostra, ele pode replicar e sintetizar a voz do falante. Isso inclui o tom e a emoção do orador. A Microsoft criou essa IA assumindo que os falantes aprovaram o uso de sua voz. Os usuários nunca devem usar a voz de outro falante sem o seu conhecimento, pois isso pode causar problemas legais. [1]

usa para Vall-e

Alguns usos comuns e aprovados para o Vall-e incluem: Aprendizagem Educacional: Professores e desenvolvedores de currículo podem implementar o Vall-E em seus planos educacionais para vários fins. Os instrutores podem usar o Vall-E para criar atividades digitais interativas e aprimorar as atividades de aprendizado de idiomas. Tradução: Vall-e apresenta inúmeras possibilidades de aprendizado e pronúncia de idiomas. E com o Vall-E X, o mais recente aprimoramento do Vall-E para a síntese de fala para fala, você poderá traduzir o discurso de um idioma para outro com facilidade. [2] Criação de conteúdo: os criadores podem usar o Vall-E para produzir podcasts e dublagens de vídeo a partir de scripts de texto. Produção de audiolivros: os autores podem gerar versões de áudio instantâneas de seus livros em suas próprias vozes, em vez de narrá -las. Robótica: Vall-e pode ser integrada a dispositivos domésticos robóticos e inteligentes para facilitar melhor a interação humana. Entretenimento: existem inúmeros usos para clonagem de voz para entretenimento pessoal, desde clonar sua própria voz até emular celebridades e pessoas que você conhece. Recursos de acessibilidade: aprimorar o software, hardware e itens domésticos inteligentes com recursos de voz de IA melhora a acessibilidade para pessoas com deficiências visuais. Atendimento ao cliente: as empresas podem usar o Vall-e para criar chatbots de voz que podem receber chamadas telefônicas ao vivo e interagir audivelmente online.

  • Aprendizagem educacional: Professores e desenvolvedores de currículo podem implementar o Vall-E em seus planos educacionais para vários fins. Os instrutores podem usar o Vall-E para criar atividades digitais interativas e aprimorar as atividades de aprendizagem de idiomas.
  • Tradução: Vall-e apresenta inúmeras possibilidades de aprendizado e pronúncia de idiomas. E com o Vall-e X, o mais recente aprimoramento do Vall-E para a síntese de fala para fala, você poderá traduzir o discurso de um idioma para outro com facilidade. [2]
  • Criação de conteúdo: os criadores podem usar o Vall-e para produzir podcasts e dublagens de vídeo a partir de scripts de texto.
  • Produção de audiolivros: os autores podem gerar versões de áudio instantâneas de seus livros em suas próprias vozes em vez de narrá -las.
  • Robótica: Vall-e pode ser integrada a dispositivos domésticos robóticos e inteligentes para facilitar melhor a interação humana.
  • Entretenimento: existem inúmeros usos para a clonagem de voz para entretenimento pessoal, desde clonar sua própria voz até emular celebridades e pessoas que você conhece.
  • Recursos de acessibilidade: aprimorando o software, o hardware e os itens domésticos inteligentes com recursos de voz da IA ​​melhora a acessibilidade para pessoas com deficiências visuais.
  • Atendimento ao cliente: as empresas podem usar o Vall-e para criar chatbots de voz que podem receber telefonemas ao vivo e interagir audivelmente online.