Pruebe nuestro LLM Masker
Pruebe nuestro LLM Masker
Featured Image

4 minutos de lectura

30/09/2021

PangeaMT: a la vanguardia del desarrollo de soluciones de traducción automática

Hoy presentamos PangeaMT, la división tecnológica de Pangeanic, el laboratorio de innovación de Pangeanic y motor del desarrollo de soluciones de procesamiento del lenguaje. El lugar dónde se crean las aplicaciones disruptivas que marcan el ritmo del sector de motores de traducción.

¿Cómo surge la división tecnológica de Pangeanic?

PangeaMT lidera el desarrollo tecnológico dentro de Pangeanic. Como división tecnológica, su creación responde a las necesidades concretas del sector. Acompañados por Manuel Herranz, descubrimos sus más de 10 años de historia y avances dentro de la industria de la traducción automática. 

“Alrededor del año 2008 empezamos a colaborar con la Politécnica de Valencia y diversas universidades europeas para idear soluciones a nuestros clientes, sobre todo en el sector de la automoción y electrónica de consumo y profesional. En aquellos días había mucha documentación que acompañaba a cualquier máquina, los típicos manuales técnicos de usuario, con un “lenguaje controlado”. Es decir, nada de florituras y con una terminología y expresiones sencillas de entender o al menos un lenguaje claro.”

Tras esta primera etapa y con nuevas colaboraciones para la creación de patrones de reconocimiento estadístico del lenguaje, por fin se crea un departamento dedicado específicamente al desarrollo tecnológico. 

Y fue, gracias a esta apuesta por la aplicación de matemática de la estadística en el lenguaje, que Pangeanic se convirtió en una de las pocas empresas del mundo que utilizaba la SMT para producir publicaciones con mayor rapidez y éxito en aquellos idiomas de sintaxis similar. 

Otro de los grandes hitos dentro de la historia de PangeaMT fue la asociación con la empresa japonesa Toshiba, con la que Manuel nos cuenta, se crearon máquinas híbridas para la resolución de problemas en lenguas lejanas, dada la limitación estadística en aquél momento. 

Desde entonces, PangeaMT ha crecido y evolucionado, liderando la innovación dentro del sector. A continuación conoceremos casos de uso y las tecnologías que marcan la diferencia en la industria.

Cómo la traducción automática y las redes neuronales facilitaron el acceso a la información en época de pandemia.

Uno de los grandes retos a los que la traducción automática se enfrenta, es la consecución de datos de calidad para su entrenamiento. Para poder construir motores hiper especializados se necesitan grandes cantidades de conocimientos y datos para que la IA pueda analizar y aprender de ésta. 

TAUS proveyó a PangeaMT casi 2 millones de palabras para su uso en la construcción de modelos de traducción automática específicos del sector sanitario. Sumergidos en una época en la que el COVID-19 alcanzó su mayor impacto en la sociedad, estas soluciones personalizadas permitieron traducir documentos del inglés al español, alemán, polaco, ruso y chino. 

Descubra más sobre el caso de uso PangeaMT: Traducción Automática Adaptativa para TAUS

Deep Adaptive, la clave para que las máquinas comprendan el lenguaje humano. 

Manuel Herranz, nos explica en qué consiste el llamado Deep Adaptive (adaptación profunda), la tecnología que está revolucionando el sector de la traducción automática:

Deep Adaptive es un motor de traducción perfectamente adaptado a las necesidades del cliente, incluso con sus propios giros. Un proceso que analiza el texto de entrada para examinar su terminología y características, busca en nuestra enorme base de datos material similar y prioriza ambos en nuestros enormes motores generales para crear una adaptación profunda.”

La tecnología Deep Adaptive permite a las máquinas realizar un análisis mucho más profundo, relacionando el idioma de origen y el de destino de una forma casi humana. Es por ello que decimos que conseguimos que comprendan el lenguaje humano ya que no se limitan a realizar una traducción automática, sino que se contemplan parámetros que hasta ahora, eran de uso exclusivamente humano. Con ésto, nos referimos al uso estilístico dentro de una empresa, institución o al tono y voz de una marca. Los motores aprenden a través de los datos proporcionados por el humano, creando un bucle de aprendizaje único para cada cliente. 

Con PangeaMT, esta tecnología llega también a diferentes servicios PLN como pueda ser la anonimización, la sumarización, crawling en páginas web o la clasificación de documentos y datos.  Un amplio espectro de soluciones y desarrollos tecnológicos combinados entre sí, que generan una potente base de datos para el entrenamiento de procesos de inteligencia artificial y gestión de la información. 

¿Cómo podríamos utilizar la tecnología Deep Adaptive? 

Manuel Herranz, nos responde con un ejemplo de los muchos beneficios que este desarrollo ofrece a empresas de diferentes sectores:

“Por ejemplo, uno de nuestros clientes necesita monitorizar ciertas noticias que solo se publican en ciertas webs y en ciertos idiomas. Al saber qué noticias les han interesado y cuáles no les han interesado a los periodistas de este servicio, hacemos una traducción de alta calidad al español y después una selección por relevancia con un análisis del sentimiento avanzado. Después se extraen palabras clave y se clasifica el artículo dentro de un campo concreto. A partir de ahí el o la periodista ya aúna la información para sus propias conclusiones. Nuestra investigación ahora mismo se centra en realizar un resumen o abstracción que, además, le proporcione una entradilla para saber a vista de pájaro de qué trata la información.

Este tipo de solución es muy relevante como gestor del conocimiento para grandes organizaciones.”

 

El valor de los datos; el futuro está en su generación y análisis. 

Inmersos en la época del Big Data, en un momento en el que muchas empresas tienen la oportunidad de generar grandes cantidades de información con la que trabajar, Manuel nos deja clara su postura: 

«Las organizaciones que no son conscientes de que tienen un problema de datos, tienen un gran problema de datos.»

Y es que, recopilar datos, ya no es suficiente, el verdadero valor está en su análisis, en el conocimiento profundo que éstos pueden otorgar a una organización. Información sobre sus usuarios, clientes y comunidad; llegar a analizar mejor qué ocurre con su comunidad y alrededor de ésta, para proponer mejores soluciones que realmente satisfagan las necesidades de su público y fidelice a sus clientes.

Y es éste análisis realmente profundo, capaz de monitorizar diversas perspectivas del lenguaje, dónde extraemos la información verdaderamente relevante. Cómo nos comunicamos sin importar el idioma, qué opiniones recibe un producto o servicio, cuándo y cómo se mencionan a las personas en los textos. La tecnología ha de ser capaz de extraer todo estos parámetros para un posterior análisis humano, que nos permita así tomar mejores decisiones. 

“Al usar la matemática extrema, podemos “predecir” las posibilidades de que algo pase, y eso es muy valioso. Podemos predecir cómo se dice una frase en otro idioma y además darle el giro deseado. Podemos predecir las posibilidades de que ciertos comentarios indiquen que algo no va bien con sus usuarios, y extraer los peores resultados o documentos para análisis. 

Podemos clasificar información a una velocidad a la que los humanos no pueden funcionar. 

Esto crea nuevos y mejores trabajos para la sociedad también, y nos basamos cada día más en la información para hacer mejores humanos.”

La clave, como Manuel concluye, está en la poderosa combinación entre la inteligencia artificial y la humana.