|05/12/23 09:28 AM

Bariloche: crearon un sistema que modifica la voz con Inteligencia Artificial

Se trata de una plataforma que puede "segmentar los componentes del habla". La novedad es que se puede hacer con cualquier computadora, sin necesidad de que sea un equipo potente

Por Redacción

05 de diciembre, 2023 - 09:32

La Inteligencia Artificial sigue brindando novedades cada tanto. Esta vez la noticia viene desde la Patagonia, más precisamente desde la ciudad de  Bariloche: allí crearon un sistema que modifica la voz, al segmentar los principales componentes del habla. Se llama Neuralwave, y es el resultado del trabajo de Julián Ñener y Raúl Sosa.

Neuralwave distingue el mensaje, la emoción y el acento de la voz. "En el milisegundo que vos hablás, sale el audio" cuenta Ñener, ganador con Sosa del primer puesto del Concurso IB50K 2023, organizado por el Instituto Balseiro. Según el joven rionegrino, es una solución para las grandes productoras de videojuegos, TV y películas que gastan sus presupuestos en contratar actores de voz, además de que permite acortar las demoras de este tipo de procesos.

Este sistema permite que un solo usuario pueda hacer todas las voces distintas, y permite también editar el componente de la emoción o el acento, sin cambiar la voz. De esta manera, en una película o serie se puede cambiar la voz para que hable en otro idioma, manteniendo la voz original.

Cómo nació Neuralwave

Tanto Sosa como Ñener tenían contacto con pequeños desarrolladores de videojuegos, quienes les comentaron que tenían un problema: generar voces distintas para sus proyectos. "Nos comentaron eso y pensamos en la posibilidad de darle cualquier voz a cualquier persona", recuerda Ñener. 

Este "voz a voz" permite más control, y es el motivo por el que este emprendimiento apunta al tipo de productoras que requieran "voces altamente emocionales" para este tipo de proyectos.

Las contras del proyecto

El aporte de estos desarrollos en cuanto al ahorro de tiempo y dinero es esencial, pero tiene una contraparte: la pérdida de profesionalidad de la voz, y de puestos de trabajo. "Está poniendo en manos del público general programas que permiten clonar voces, no pagar por esa clonación", explica Sergio Colman, secretario general de la Sociedad Argentina de Locutores y Conductores.

El uso de estos programas "va a tender a suplantar la voz del locutor, porque no contempla la propiedad intelectual y el usuario, que están reguladas por la actividad profesional", agrega Colman. Sin embargo, se apresura a aclarar que, en cuanto a los derechos y permisos de los dueños de las voces, "somos éticos, estamos de acuerdo con la ética de la IA, y no liberamos al público la tecnología de la clonación".