La empresa de inteligencia artificial (IA) OpenAI dijo este lunes que mediante su modelo Voice Engine puede clonar voces humanas reproduciendo un sonido natural “emotivo y realista” usando una muestra de 15 segundos, pero que aún no lanzará la tecnología al público general, ya que sería demasiado arriesgado.
Voice Engine es un nuevo modelo de IA que puede convertir texto a voz para crear voces sintéticas, que, según la compañía, pueden permitir que los creadores de contenidos puedan traducir su trabajo en otras lenguas sin perder sus acentos nativos y ayudar a las personas con problemas de comunicación verbal a usar su voz para, por ejemplo, llamar por teléfono. Lea también: ¡Ahora podrás saber cuándo vas a morir!, la Inteligencia Artificial te lo dice
En uno de los ejemplos que da la empresa se puede escuchar como la voz de una anglosajona se tradujo al español, mandarín, alemán, francés y japonés conservando el acento nativo de la persona.
“Estamos adoptando un enfoque cauteloso e informado para una publicación más amplia debido al potencial de uso indebido de la voz sintética”, indicó la empresa en el comunicado donde además apunta que las empresas con las que trabajan han aceptado sus políticas de uso.
Entre esas reglas está que no se use la voz de alguien sin su consentimiento o que hay que indicar a los usuarios que son voces sintéticas. Puede interesarle: Colombia ocupa el tercer puesto en consultas a ChatGPT, según informes
“Finalmente, hemos implementado un conjunto de medidas de seguridad, que incluyen marcas de agua para rastrear el origen de cualquier audio generado por Voice Engine, así como un monitoreo proactivo de cómo se utiliza”, añadió OpenAI.