Durante los días 21, 22 y 23 de agosto se celebró en Dublín el MT-Summit 2019. Los dos días previos a la conferencia principal tuvieron lugar diversos workshops en los que se trataron los nuevos retos en traducción automática como el multilingualismo, la literatura, las dificultades con lenguas para las que se dispone de pocos recursos y la importancia de la traducción automática en situaciones de crisis. Además, también tuvieron lugar diversos tutoriales que proporcionaron información sobre las redes neuronales, estadísticas y cómo elegir un buen conjunto de datos para realizar tests. La conferencia principal se prolongó durante 3 días y se dividió en tres áreas: investigadores, traductores y usuarios, con el fin de unir a todos los colectivos que emplean traducción automática. Hoy en día la calidad de la traducción automática neuronal es mucho mayor y está más integrada en la industria de la traducción. La figura del traductor que posedita es cada vez más relevante, no obstante, es necesario que los traductores posean un dominio excelente de su lengua nativa para añadir valor al contenido de la traducción automática.
Algunos de los temas más discutidos este año han sido la traducción del habla, el transfer learning, los modelos especializados en un dominio concreto, la traducción de idiomas para los que se dispone de pocos materiales y la posedición utilizando modelos de traducción automática neuronal.
Presentación oral de Pangeanic
Pangeanic presentó su estudio “incremental adaptation of neural machine translation for professional post-editors”, el cual está disponible en los proceedings, en la página 219. Este trabajo se llevó a cabo junto con el grupo de investigación PRHLT de la Universidad Politécnica de Valencia en el marco del proyecto hybrid NMT platform. El estudio consistió en actualizar de forma incremental los modelos de traducción automática neuronal bajo un paradigma de online learning aplicado en un escenario de traducción real. Los resultados mostraron que al poseditar los resultados obtenidos del sistema los traductores trabajaban con mayor facilidad y rapidez. Además, se mejoró la calidad de la traducción y la percepción por parte de los usuarios de este sistema.
Sesión de pósters
Pangeanic presentó los proyectos NEC TM y iADAATPA en la sesión de pósters. El objetivo del consorcio de datos NEC TM es organizar archivos bilingües nacionales que no han sido aprovechados para utilizarlos como datos generales y abiertos para machine learning. Recoge memorias de traducción de adjudicaciones de contratos nacionales que se han realizado en el pasado por los Estados Miembros y les ayuda a centralizar estos recursos lingüísticos con la base de datos de alto rendimiento de NEC TM. iADAATPA es una plataforma que amplía la traducción automática y ofrece a los proveedores de traducción automática la posibilidad de trabajar con clientes del mercado europeo al proporcionarles motores adaptados al dominio.
El centro ADAPT también presentó un póster sobre la evaluación de los motores de traducción automática entrenados en el marco iADAATPA, mostrando mejoras en la traducción de los datos de dominio específico proporcionados por las instituciones de los Estados Miembros de la Unión Europea.
Sponsors
Pangeanic fue uno de los patrocinadores de la conferencia, en la que tuvimos nuestra propia mesa para informar a los asistentes y ponentes sobre nuestras tecnologías de procesamiento del lenguaje natural.
Próximos eventos
El evento concluyó con la ceremonia de cierre, en la que se presentó el próximo MT-Summit, que tendrá lugar en Seattle, en los Estados Unidos. Además, también se anunció que la EAMT 2020 tendrá lugar en Lisboa y que la AAMT 2020 se celebrará en Orlando.