El pasado noviembre se celebró la conferencia sobre traducción automática
Workshop of Machine Translation (WMT) 2021
, un
evento internacional
de gran prestigio cuyo principal objetivo es presentar avances en la investigación de la traducción automática. Además, los grupos de investigación pueden enviar el resultado de la traducción automática de un sistema desarrollado para la competición de la WMT. Existen diferentes categorías en la competición que consisten en traducir noticias, datos médicos, lenguas similares, lenguas con pocos recursos, poseditar de forma automática, medir la calidad de las traducciones automáticamente, etc.
Los participantes presentan sus sistemas de traducción automática y en la competición se analizan y se evalúan sus traducciones.
Como ya hicimos en la edición anterior, el equipo de Pangeanic hemos participado activamente en esta importante conferencia, compartiendo nuestros conocimientos y experiencia sobre tecnologías de
inteligencia artificial (IA) aplicadas a la traducción automática y al procesamiento del lenguaje
.
Pangeanic en la WMT 2021: proveedores de datos para lenguas romances
La región de Punta Cana, en República Dominicana, ha sido el paradisíaco entorno elegido para organizar, entre los días 7 y 11 de noviembre de 2021, la última edición de la WMT, que también puede seguirse en línea. Se trata de un evento que forma parte de la conferencia internacional de alto nivel EMNLP 2021 sobre procesamiento del lenguaje natural.
Como consecuencia del creciente interés por
aprovechar la similitud entre ciertos idiomas
para
mejorar la calidad de la traducción automática en idiomas con menos recursos
, la WMT 2021 ha incluido en su programa la traducción automática de idiomas parecidos. Se han diferenciado tres familias lingüísticas: tamil y telugu (idiomas dravidianos), español, catalán, portugués y rumano (lenguas romances) y bámbara y mandinká (idiomas del África occidental).
La aportación de Pangeanic ha sido
proporcionar traducciones paralelas de español, catalán y portugués
, con el fin de construir un conjunto de datos de prueba para evaluar la calidad y las prestaciones de los sistemas de traducción automática aplicados a las distintas lenguas romances, ya que estas presentan muchas similitudes en vocabulario y estructuras gramaticales.
La importancia de los datos de desarrollo y prueba en la traducción automática
Eventos como la WMT son absolutamente necesarios para presentar las nuevas tendencias en traducción automática y analizar
la calidad de las traducciones automáticas
en diferentes tareas y campos de aplicación, como la traducción de noticias o textos especializados (médicos, jurídicos, técnicos, etc.).
Lo que se persigue en estas conferencias internacionales, donde se reúnen los mejores profesionales y empresas especializadas en el desarrollo y uso de sistemas automáticos de procesamiento del lenguaje, es
establecer métricas automatizadas, de la forma más objetiva posible, para evaluar la calidad de las traducciones
mediante la creación de sistemas de puntuaciones precisos, segmentados y objetivos.
La meta final de los trabajos de evaluación llevados a cabo en la WMT 2021 es alcanzar la
máxima correlación
entre las
evaluaciones automáticas y las evaluaciones humanas
.
PangeaMT, IA en el procesamiento del lenguaje
A través de nuestra subdivisión
PangeaMT
, en Pangeanic hemos desarrollado una
tecnología propia de IA
, que nos permite crear
soluciones personalizadas de traducción automática
que se adaptan a las necesidades concretas y específicas de cada cliente.
Además, hemos creado
ECO
, un
ecosistema de procesamiento del lenguaje
que, en cuestión de minutos, obtiene la información que necesita para
adaptarse al estilo de lenguaje
de cada usuario, además de obtener información de valor procesable a partir de datos de textos, tanto estructurados como no estructurados.
Nuestro sistema permite
cumplir con la normativa de privacidad (anonimización)
y entrenar modelos especializados con el fin de realizar traducciones automáticas cada vez más rápidas y perfeccionadas.
Otra de nuestras prestaciones de alto nivel que ponemos a disposición de los clientes es nuestro
servicio privado en la nube
, desde donde es posible trabajar en prácticamente cualquier lugar con
total seguridad y con la garantía de disponer de continuidad del servicio
en todo momento, ya que nuestros servidores están ubicados en tres grandes jurisdicciones: Europa, EE. UU. y Japón.
Estamos preparados para realizar
traducciones automáticas de máxima calidad en más de 500 combinaciones de idiomas
y nuestra anonimización está disponible en 25 lenguas.
Nuestra participación en
eventos de la talla de la WMT 2021
no hace más que demostrar y apuntalar nuestro compromiso con la
traducción automática y el procesamiento del lenguaje natural
, contando para ello con el mejor equipo humano y la tecnología más puntera y eficaz.