viernes, 27 de mayo de 2022

Sistema de creación automática de vocabularios para facilitar el aprendizaje léxico...

 Desarrollan alumnos del IPN sistema para facilitar el aprendizaje de lenguas.

Ciudad de México a 27 de mayo de 2022.- El aprendizaje de lenguas es un tema profundamente estudiado desde hace décadas y desde múltiples perspectivas disciplinarias. En este contexto, la continua creación de ejercicios nuevos resulta una tarea casi imposible para los docentes debido a la carga de trabajo,  por lo que alumnos del Instituto Politécnico Nacional (IPN) desarrollan un Sistema de creación automática de vocabularios para facilitar el aprendizaje léxico de humanos y máquinas.

Los alumnos, que pertenecen al Centro de Investigación en Computación y (CIC) forman parte del Laboratorio de Lenguaje Natural y Procesamiento de Texto, aplican  técnicas de ciencia de datos (CdD) e Inteligencia Artificial (IA) para generar vocabularios de palabras y frases de forma automatizada, produciendo nuevos vocabularios contextualizados de manera continua. Esto coadyuvará a liberar tiempo a los profesores de enseñanza de idiomas para que puedan dedicarlo a la atención personalizada y la planeación de sus clases, mientras que se facilita la gamificación y la generación de actividades novedosas que capturen con mayor facilidad la atención de los alumnos.

El equipo es experto en el desarrollo de sistemas inteligentes basados en el tratamiento del lenguaje natural, con el objetivo de desarrollar un prototipo de aplicación para crear vocabularios que aporten material pedagógico en la enseñanza de lenguas, y contribuyen con una herramienta que será de apoyo fundamental para los profesores.

Con ello, se proveerá de un repositorio avanzado de vocabularios usando técnicas de ciencia de datos y procesamiento de lenguaje natural para facilitar el aprendizaje, que se concretará con una aplicación de interfaz sencilla y amigable que permita su uso por cualquier persona con acceso a internet, para la consulta de vocabularios.

Se contará con una base de datos abierta que almacene los vocabularios, incluyendo las múltiples traducciones de cada vocablo por lengua que considere además los atributos específicos léxicos de cada palabra, además de fácil acceso para que servirá a investigadores de diferentes áreas y disciplinas con fines académicos.

El desarrollo emplea metodologías ágiles para la planeación y dirección de proyectos de software que hacen uso de tecnologías modernas, como lo es el tratamiento de texto multilingüe. Ello sirve para  capturar las características requeridas para efectiva comprensión de las necesidades y resolución de problemas al involucrar a la comunidad objetivo en el desarrollo del aplicativo.

El equipo trabaja en la implementación los algoritmos específicos en la generación de vocabularios, diseño de interfaces gráficas y experiencia de usuario; el ensamblado de prototipo y realización de pruebas y al concluir el desarrollo publicarán un artículo científico para informar los procedimientos realizados.

Carlos Alberto Rodríguez Díaz es el responsable técnico y el Dr. Alexander Gelbukh se desempeña como Académico Co-responsable Técnico del equipo integrado por Jason Efrain Angel Gil, Sabur Butt, Oxana Vitman, José Eduardo Valdés Rojas,  Isaac Carballo Pérez, Luis Edgar Poblano Díaz.

 

***

Acerca del equipo.

Está integrado con alumnos de Maestría y Doctorado, colaboradores de ESCOM (pregrado) y de universidades extranjeras con amplia trayectoria en el procesamiento de textos, creación de aplicaciones innovadoras;  análisis de redes sociales, emociones y sentimientos en textos de redes sociales, análisis de opinión, aplicación de las técnicas del aprendizaje automático y las redes neuronales, incluido el aprendizaje profundo (deep learning) y tratamiento del texto en diversas lenguas. Tiene apoyo de  Iara Mantenuto (UCLA/CSU)Manuel Mager (Stuttgart/UNAM) y Verónica Dahl (SFU).  Ha ganado numerosos concursos internacionales, en todos estos campos así como detección de plagio, detección del lenguaje nativo, detección de género del autor, detección de intenciones textuales. Desarrolló un aplicativo móvil para apoyar a comunidades minoritarias y personas con pérdida de la visión. Ha publicado más de 600 artículos en estos temas, con más de siete mil citas por Google Académico, 17 publicaciones de técnicas novedosas de inteligencia artificial y aprendizaje profundo (deep learning) para la extracción automática del sentimiento y las opiniones expresadas (alegría, tristeza, odio, sorpresa, etc.). Los investigadores del grupo están entre los 100 más citados en los temas de la lingüística computacional y entre los 11 más citados del mundo en el análisis de sentimientos, según Google Académico. Ha desarrollado más de 70 proyectos de investigación y desarrollo de software de nivel institucional, nacional e internacional, entre éstos, 24 proyectos relacionados al uso del lenguaje natural para el análisis de sentimientos en redes sociales. El equipo fue ganador  en Junio de 2021 de la reciente competencia internacional Facebook BeMyApp F8 Refresh Hackathon 2021 sobre el desarrollo de un prototipo de aplicativo móvil que usa inteligencia artificial para apoyo a comunidades minoritarias en la interacción con el MarketPlace de Facebook. Ha ganado numerosos premios por mejor tesis y mejor artículo en las áreas del procesamiento de texto e inteligencia artificial, véase esta página. Este año el líder del laboratorio y colaborador de este proyecto ganó la medalla Lázaro Cárdenas, siendo la quinta medalla Lázaro Cárdenas otorgada al grupo.

 

Referencias.

Santos, J. A., dos Santos Bernardi, L. T. M., & Bonifaz, R. (2018). Nuevas Tecnologías en la educación:¿ neutralidad o políticas pedagógicas? Un abordaje desde la Pedagogía de Paulo Freire. Revista Latinoamericana de Tecnología Educativa-RELATEC, 17.

Narbona, J. (2001). Alta prevalencia del TDAH: ¿niños trastornados, o sociedad maltrecha?