Rohit Prasad, científico principal de Amazon para Alexa, dijo en un evento en vivo el miércoles que su equipo ha estado instruyendo a Alexa para que capte una voz de un clip de audio corto y la convierta en una salida de audio más larga.

Mostró un video corto de cómo las personas podrían usar la capacidad de cambio de voz de Alexa en la vida real. En el clip, un niño pregunta: «Alexa, ¿puede la abuela terminar de leerme el Mago de Oz?».
El altavoz inteligente confirmó la solicitud en su voz alegre predeterminada, luego pasó a una voz menos robótica que narró un extracto de la novela infantil.
«Esto requirió inventos en los que tuvimos que aprender a producir una voz de alta calidad con menos de un minuto de grabación en lugar de horas de grabación en el estudio. La forma en que lo hicimos posible fue enmarcando el problema como una tarea de conversión de voz y no un camino de generación del habla», dijo Prasad.
Prasad dijo que la capacidad de Alexa para hacerse pasar por voces familiares es particularmente crucial ahora, ya que muchas personas perdieron a sus seres queridos por el Covid-19.
«Si bien la IA no puede eliminar el dolor de la pérdida, definitivamente puede hacer que sus recuerdos perduren», dijo.
Prasad no dijo cuándo Amazon presentará al público la capacidad de imitación de voz de Alexa. Un portavoz de Amazon rechazó la solicitud de comentarios de Insider.
La capacidad de Alexa para imitar voces es una forma de inteligencia artificial (IA) que Prasad llamó «inteligencia generalizable». La capacidad ayuda a Alexa a adaptarse a diferentes situaciones y adquirir nuevos conocimientos a partir de las experiencias con poca supervisión, dijo.
Es diferente de la inteligencia artificial general «que todo lo sabe y todo lo puede» —o AGI— que tiene como objetivo comprender las tareas humanas y el intelecto para resolver problemas, dijo Prasad. Organizaciones como DeepMind de Google y OpenAI de Elon Musk están enfocadas en perfeccionar AGI.
Amazon no es la única empresa que trabaja en el desarrollo de tecnología que pueda imitar las voces humanas. El mes pasado, el fabricante de juguetes japonés Takara Tomy presentó un dispositivo con forma de huevo que cambia la voz llamado Coemo que copia las voces de los adultos y las usa para leer cuentos a los niños.
En Twitter, la gente estaba dividida sobre los planes de Amazon para enseñarle a Alexa a imitar las voces humanas.
Una persona llamada «Maltese Mama» dijo que Alexa podría mantener mentalmente activos a sus padres, que tienen demencia y viven lejos. «Tenemos cuidadores que van todos los días, pero poder llegar al máximo (sic) o incluso mejor entrar con una videollamada es increíble», tuiteó en respuesta a la presentación de Prasad.
Fuente: Xataka México
Комментарии