REDACCIÓN 14/10/2019 10:22
Alexa ha introducido recientemente el portugués de Brasil y el español de Estados Unidos a la lista de idiomas que puede hablar, después de seguir un proceso de aprendizaje que no depende de las interacciones de los usuarios con el asistente, sino que emplea técnicas como la inducción gramatical o el muestreo guiado.
MADRID, 14 (Portaltic/EP) Alexa ha introducido recientemente el portugués de Brasil y el español de Estados Unidos a la lista de idiomas que puede hablar, después de seguir un proceso de aprendizaje que no depende de las interacciones de los usuarios con el asistente, sino que emplea técnicas como la inducción gramatical o el muestreo guiado. "Cuando una versión de Alexa en un nuevo idioma está en desarrollo, los datos de capacitación para sus sistemas de comprensión de lenguaje natural (NLU) son escasos", explica la compañía en una entrada en su blog oficial. En estos casos, el equipo de desarrollo de Alexa emplea lo que se denomina enunciados dorados ('golden utterances'), comandos propuestos por los desarrolladores a modo de ejemplo, y trabaja con ellos siguiendo distintas técnicas para potenciar el entrenamiento. Así, los desarrolladores siguen una técnica denominada inducción gramatical, que, como explican, "analiza un puñado de enunciados dorados para aprender patrones sintácticos y semánticos", con los que es capaz de generar "miles de nuevas oraciones similares". Esta técnica lo que hace es acelerar el aprendizaje de un nuevo idioma cuando no hay un gran número de ejemplos procedentes de usuarios con los que trabajar. Así, "dada una lista de 50 enunciados dorados, un lingüista computacional podría generar una gramática representativa en un día, y podría ser operacionalizada al final del siguiente día", señalan en el blog de Alexa. Los desarrolladores de Alexa mencionan también el enfoque conocido como fusión de modelo bayesiano, que "identifica patrones lingüísticos en listas de enunciados dorados y los usa para generar reglas candidatas para diferentes plantillas de oraciones", con la que pueden establecer si, en contextos definidos, dos palabras son intercambiables, por ejemplo. Otra técnica, muestreo guiado, permite generar nuevas oraciones mediante la "combinación de palabras y frases de los ejemplos disponibles en los datos" y está enfocada a "maximizar la precisión de los modelos NLU resultantes". Esta técnica emplea también datos de entrenamiento disponibles, tanto de otros idiomas disponibles en Alexa como de fuentes de medios digitales, para dotar de contexto.