Joining the Loop. Una charla sobre inteligencia artificial y humana con Mª Ángeles García

Escrito por M.Ángeles García | 22/03/22
La combinación de inteligencia humana y artificial sigue siendo la clave para conseguir resultados excelentes en el procesamiento del lenguaje natural. Pese a esto, la traducción automática está cada vez más presente gracias a su capacidad para procesar enormes cantidades de datos, siendo una herramienta potente y crucial para derribar las barreras de los idiomas. Sin embargo, la clave para conseguir ese equilibrio entre tecnología y trabajo manual está en la figura del poseditor. La pieza humana encargada no sólo de asegurar la calidad de las traducciones, sino de entrenar a modelos de inteligencia artificial para acercarnos cada vez más, a la ambiciosa paridad humana.  Hoy hablamos con MªÁngeles García Escrivà, Senior Project Manager en Pangeanic, para descubrir desde dentro la figura del human-in-the-loop .  

La traducción automática suele ser un tema que divide opiniones en el sector de la traducción, ¿A qué crees que se debe?

Por una parte, muchos lingüistas temen quedarse sin trabajo si la traducción automática se desarrolla demasiado. Y, por otra parte, los clientes temen recibir una traducción de calidad inferior si es una máquina quien la realiza.  

¿Podrías explicarnos en qué consiste el concepto Human in the Loop y cómo se aplica en vuestra experiencia como lingüistas y traductores?

En el caso de la traducción automática, Human in the loop hace referencia a la participación humana en su desarrollo y a cómo su contribución es imprescindible en diversos aspectos del proceso. Podemos nombrar, como aspecto principal, el papel del traductor en la tarea de posedición que ofrece calidad humana al cliente final basándose en una traducción automática, lo cual acelera el flujo de trabajo.  También cabría comentar la contribución de los humanos (en este caso lingüistas) en la traducción y revisión de datos con los que se entrenan los modelos de inteligencia artificial usados en los modelos de traducción automática. Y no podemos olvidar que nada de todo esto sería posible sin el trabajo de los humanos que crean las máquinas y las entrenan, me refiero a los ingenieros, desarrolladores y científicos, por supuesto.  

En cuanto al aprendizaje de los motores de traducción automática, sabemos que Pangeanic trabaja con diferentes idiomas de alrededor del mundo. ¿Cuáles son, desde tu experiencia como traductora, los más complejos?

En realidad, yo no hablaría de un idioma concreto, sino de combinaciones de idiomas. Lo complicado es llevar a cabo traducciones automáticas en combinaciones muy alejadas sintácticamente, como por ejemplo de islandés a chino. Y, sobre todo, hay que tener en cuenta la disponibilidad de datos de entrenamiento. Cuantos menos datos de entrenamiento tenemos, peores resultados obtiene nuestro modelo, lo que se traduce en una calidad inferior de nuestra traducción automática para esa combinación.  “Lo complicado es llevar a cabo traducciones automáticas en combinaciones muy alejadas sintácticamente, como por ejemplo de islandés a chino” Siguiendo con el ejemplo anterior, no es fácil conseguir documentos traducidos de islandés a chino o viceversa, a no ser que se creen bajo petición, lo cual es costoso y en ocasiones casi imposible, ya que es muy difícil encontrar traductores humanos con esa combinación lingüística. Por esa razón los motores que mejor funcionan suelen ser aquellos cuya disponibilidad documental traducida es mayor.  
Le podría interesar: últimas tendencias de la industria de la traducción
 

 ¿Cuáles crees que suponen un mayor reto para la máquina y para el traductor humano?

Definitivamente no creo que haya idiomas complejos, el traductor humano conoce bien su idioma nativo, independientemente de si es chino, zulú o español. No tendrá problemas al traducir si además conoce bien el idioma de origen y el dominio del texto. Sin embargo, en el caso de la máquina, los factores que más influyen son la cantidad y diversidad de datos disponibles para su entrenamiento y el nivel de pertenencia al dominio del texto a traducir. Por lo tanto, vuelvo al mismo caso de antes, serán idiomas que no tengan grandes cantidades de datos documentales traducidos, normalmente esa situación se da con lenguas minoritarias ( idioma s que en una comunidad o Estado utilizan un reducido número de hablantes).  

Hablemos de ECO. Quizás algunos lectores puedan pensar que la aparición de este tipo de plataformas amenaza la figura del traductor humano. ¿Cuál es tu opinión al respecto?

El gran desarrollo de la IA en los últimos tiempos hará desaparecer muchos tipos de oficios tal y como los conocemos hoy en día, pero propiciará la aparición de nuevas figuras muy necesarias en un futuro que ya es inminente. 

¿Cuál es el papel del traductor humano respecto a los motores de traducción automática?

Ahora mismo tiene 2 funciones principales:  
  • La figura del “poseditor” (figura introducida en el sector de la lingüística a partir de la aparición de la traducción automática) encargado de corregir los posibles errores obtenidos a través de la traducción automática e incluso de mejorar el estilo y la adecuación del texto de destino.
  • La figura del validador y creador de unidades de traducción que sirvan para el entrenamiento de los motores de traducción automática. Este papel requiere de conocimientos de lingüística y traducción y es un papel esencial para el entrenamiento de los motores de traducción automática.
   

¿Qué beneficios crees que aporta al traductor humano contar con herramientas como ECO?

El beneficio más notable al trabajar con ECO, diría que es la aceleración en el proceso de traducción de un texto. Al igual que ya hicieron las herramientas de traducción asistida, los motores de traducción permiten que el traductor traduzca más rápido, ya que proporcionan parte de la traducción que usarán los traductores en el texto de destino.  

¿Nos puedes hablar de tu experiencia en algún proyecto en el que se combinaran la inteligencia humana y la artificial?

Como ya he comentado anteriormente, los proyectos que incluyen posedición en su flujo de trabajo serían un buen ejemplo, ya que, por un lado, la máquina aporta la base sobre la que se trabajará para conseguir el texto traducido. Por el otro lado, el humano perfecciona el texto para conseguir un documento adaptado a la audiencia de destino, teniendo en cuenta si el texto es técnico, legal, académico, etc. Tened en cuenta que un mismo término puede pertenecer a diferentes ámbitos o dominios y, dependiendo de cuál sea ese dominio, su traducción será una u otra. Es más, incluso dentro de un mismo dominio es posible que la traducción de un término sea diferente dependiendo del contexto.  Por ejemplo, podemos encontrar diferentes traducciones al español para la palabra “ control ” del inglés aplicada al campo de la medicina, como en el ejemplo “ to control a haemorrhage ”, su traducción correcta sería “ detener una hemorragia” y no “ controlar una hemorragia”. Otro buen ejemplo es el término “ birth control pill ” (“píldora anticonceptiva”) la traducción de “ control ” aquí se incluye en la palabra “anticonceptiva” ya que se ve ampliamente afectada por su contexto. Hoy por hoy, hay motores de traducción especializados capaces de hacer estas distinciones, pero no todos lo hacen y, sobre todo, no en todas las combinaciones. Por lo tanto, en estos casos es aún más necesaria la ayuda de un humano que controle que la traducción sea adecuada al dominio y contexto del documento a traducir.  
Siga aprendiendo → La paridad humana en traducción automática, ¿en qué consiste?
 

Respecto al futuro de la traducción automática, ¿nos puedes dar una predicción de futuro? ¿Qué les depara a las futuras generaciones de traductores y lingüistas?

Probablemente, la traducción se especializará aún más. Los traductores tendrán que ser grandes expertos en determinados campos. Nos esperan años en los que la traducción automática necesitará de grandes cantidades de documentos traducidos para el entrenamiento de los motores, especialmente de documentos especializados que enseñen a la máquina a ver esas distinciones que marcan la diferencia entre un término común y un término especializado. Y no simplemente especializado, sino especializado en un determinado campo y contexto.