Tenía apenas 14 años cuando ya tenía en claro lo que iba a ser de grande. Hizo un curso de Física en la Universidad Nacional de Salta y allí descubrió cómo la ciencia "no era solamente una ecuación o un modelo matemático". El tiempo hizo que Jimena López Morillo Guggenbichler (28) fuera, hoy, la responsable principal de que los audios de WhatsApp puedan ser convertidos en texto, una solución ideal para quienes 'odian' escuchar audios.

La joven, oriunda de Salta, se convirtió con el tiempo en ingeniera mecánica, y más tarde hizo una maestría en Robótica. Allí descubrió lo que era el mundo de la programación, y eventualmente resultó ser la cara visible de TranscribeMe, un bot de la plataforma de mensajería más famosa que desgraba los audios de WhatsApp sin necesidad de escucharlos.

En noviembre del 2022, Jime (como le gusta que la llamen) estaba hablando con su familia y se dio cuenta de que la gente estaba desconectada de la inteligencia artificial, una herramienta que utiliza a diario en su trabajo. Charló en su casa sobre el tema, y también con un compañero de trabajo, Ignacio Fabre, ingeniero nuclear. "¿Cómo podemos hacer para que nuestros amigos y familia puedan interactuar un poco más con esta herramienta?", se preguntaron. Esa fue la punta del iceberg para aplicarlo en WhatsApp.

"Pensábamos que sería muy bueno tener una herramienta que pasara a texto todos los audios que nos llegan", comentó la joven salteña. Fue en diciembre cuando comenzaron a "ponerlo en código", y al mes siguiente (enero del 2023) lanzaron la versión interna, a modo de prueba. Como todo en el mundo virtual, la novedad se viralizó y se popularizó sola.

Cada vez más gente conocía TranscribeMe, aunque sin saber el nombre de la aplicación. Miles de usuarios utilizaban ya la modalidad de transcripción a texto, sin que ellos hicieran nada. Con el uso masivo se dieron cuenta de que no solo servía para cuando uno estaba reunido y no podía escuchar los audios de WhatsApp, sino que era también una herramienta de inclusión: los niños sordos o hipoacúsicos, o los adultos mayores que no pueden escuchar bien, podían sacar el máximo provecho de la creación.

¿Cómo funciona TranscribeMe?

La ciencia detrás de TranscribeMe se basa en predecir lo que el audio está diciendo. "La inteligencia artificial entiende cuándo se separa una palabra, y aunque no pronunciemos todas las letras con la misma intensidad, 'busca' algún diccionario existente. Y además de pasar un audio a texto, envía un resumen total del audio escuchado", explica Jimena López Morillo.

La mayoría de los audios que TranscribeMe traduce tienen entre 1 y 2 minutos de longitud. La mayoría de los usuarios son de Buenos Aires y Córdoba, pero lo que más reconoce Jimena es el uso inclusivo que se le da. "Es hermoso, nunca pensamos que una escuelita de niños sordos o gente hipoacúsica iban a poder usarla. Es una forma de inclusión", reconoce la ingeniera, al tiempo que aclara que el parche no guarda ningún tipo de contenido del audio.

"Conservamos las características para saber de qué provincia vienen, y la longitud del audio, porque es algo que nos sirve como programadores. El audio se procesa, se manda la transcripción con el resumen, y no queda ningún registro de ningún tipo", comenta la joven.

La inteligencia artificial está dejando de ser artificial para convertirse directamente en inteligencia. El futuro tantas veces vislumbrado llegó, y TranscribeMe es, además de argentino, un invento que acerca a más gente. Y las incluye como parte de este presente tecnológico en el que nadie debería quedar afuera.