Menu

Diversa

Una IA copia cualquier voz en 3 segundos… ay ay ay

Mientras que la versión 4 de ChatGPT (aún no disponible para el público en general) acaba de pasar el examen de grado con gran éxito, otra IA de Microsoft, llamada Vall-E, es capaz de imitar cualquier voz en 3 segundos. AIE Aie Aie.

Las IA se mueven rápido, muy rápido, listas para tragarse nuestro último átomo. Antes de llegar allí, Vall-E, la IA de Microsoft, ahora es capaz de imitar una voz en tres segundos. Funcionando solo en inglés por el momento, ya hace muchas preguntas, comenzando por la actuación de los deepfakes que inevitablemente serán cada vez más inquietantes, ya uniéndose a una imagen digital casi en conformidad con el original, el tono de voz correcto , sin tirones o efectos espasmódicos. Hacer farol.

Y si James Dean se convirtiera en ?

Modelo de generación de voz a partir de texto (síntesis de texto a voz o TTS), Vall-E requiere un texto escrito, el que será declamado virtualmente, y un modelo de voz a imitar, independientemente del contenido. Lejos de ser robótico, el renderizado resultante de un entrenamiento de IA de 60.000 horas de grabación en inglés con 7.000 personas diferentes es francamente asombroso. Juzgue usted mismo con la demostración de Vall-E publicada por Microsoft aquí.

Las oportunidades para dichas IA son inmensas, por supuesto, y en todas las áreas. Pero, ¿realmente estamos ansiosos por descubrir al primer James Dean virtual o Marilyn más real que la vida en el cine? No estoy seguro... Fuentes: Capital / Arvix

image