Em formação

A conversão de texto em fala da Microsoft AI é incrivelmente realista

A conversão de texto em fala da Microsoft AI é incrivelmente realista


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

A Microsoft e os pesquisadores chineses podem ter descoberto uma maneira eficaz de converter texto em fala. Até agora, essa conversão vinha evoluindo de forma muito imaginativa e inteligente; no entanto, as questões de tempo de treinamento e recursos para criar resultados de som natural estavam causando atrasos.

RELACIONADOS: NOVOS PRINCÍPIOS DE INTELIGÊNCIA ARTIFICIAL DA OCDE: OS GOVERNOS CONCORDAM COM OS PADRÕES INTERNACIONAIS DE TRUSTWORTHY AI

O que a Microsoft e os pesquisadores chineses fizeram foi criar uma Inteligência Artificial (IA) de conversão de texto em fala que utiliza 200 amostras de voz para criar uma fala que soe realista para corresponder às transcrições. Isso significa aproximadamente 20 minutos.

Como isso está ligado ao cérebro?

Semelhante aos neurônios do cérebro, o sistema usa parcialmente Transformers, ou redes neurais profundas. Como nossas sinapses cerebrais, os Transformers avaliam e processam todas as informações de entrada e saída em movimento. Isso os ajuda a percorrer até mesmo sequências longas e complicadas de forma bem organizada - por exemplo, uma frase complexa.

Trabalhando com relativamente pouca informação, incluindo um codificador de remoção de voz adicionado à mixagem, como é neste caso, a IA pode, independentemente, gerenciar muito bem.

Mesmo com sons ligeiramente robóticos, a inteligibilidade de palavra das gravações chega a 99,84%. Além disso, isso pode tornar o texto em fala mais acessível. Para criar vozes com sons realistas, não seria preciso muito trabalho duro.

Os pesquisadores estão trabalhando continuamente para melhorar o sistema e têm esperança de que, no futuro, será necessário ainda menos trabalho para gerar um discurso realista.


Assista o vídeo: Python Speech Recognition. Speech To Text Converter. Google Speech (Pode 2022).