Traducción automática neuronal versus traducción con LLM basada en prompting: ¿cómo de cerca estamos?

Escrito por Manuel Herranz | 19/05/24

La reciente conferencia anual de la Asociación GALA en Valencia ha dado oficialmente inicio a la temporada de conferencias. Y, por supuesto, la cuestión dominante (la única cuestión, diría yo) fue la Inteligencia A, o más bien la GenAI y cómo está afectando a la industria del lenguaje, si habrá una industria del lenguaje en absoluto en unos pocos años, el papel y el valor de las personas en un mundo donde la IA puede producir contenido fluido tan bueno como los humanos.

Resumo por separado la contribución de Pangeanic a la conferencia y mi participación en tres presentaciones sobre "Ética de la IA en la industria de la traducción" presidida por mi admirada Olga Beregovaya de Smartling, nuestro caso de uso con la Agencia de noticias EFE y "Caminando el camino de la resistencia al uso de GenAI en producción" con mi también admirado Kirti Vashee de Translated.

La industria de la localización ha experimentado una transición que va de los modelos bilingües creados a partir de corpus a los glosarios, la TA adaptativa y, ahora, la TA con grandes modelos del lenguaje (LLM) basada en prompts. La traducción automática neuronal (NMT) sigue siendo un método muy popular por su flexibilidad, escalabilidad y rentabilidad.

En 2024, el mejor enfoque para una traducción personalizada sigue siendo la TA neuronal. Yo no apostaría nada sobre dónde estaremos en 2025, ni siquiera al final de 2024. Actualmente, sin embargo, la traducción automática adaptativa (NMT) sigue siendo la solución de traducción automática más rápida y económica para la mayoría de las aplicaciones y el estándar de oro. Ciertamente es la tecnología más fácil de controlar y adaptar. Esas son solo varias razones para ello, y no soy el único que defiende cuán válida sigue siendo la tecnología: Christian Federmann de Microsoft siempre ha defendido la flexibilidad de los modelos NMT.

Por qué reina la traducción automática adaptativa (neuronal)

Hay cuatro razones principales para ello, y el panel de la mesa redonda "Caminar por la senda de la resistencia" (Kirti Vashee, Jose Palomares y Helena Moniz) trató gradualmente todas ellas.

1. Escalabilidad Económica: La traducción automática neuronal (NMT) ha alcanzado un nivel de madurez en el que la disponibilidad de corpus paralelos permite la creación de motores de traducción automática a costos significativamente más bajos. Esto hace que la NMT sea una opción económicamente viable para muchas organizaciones, ya sea en instalaciones propias o en la nube, permitiendo a las empresas desplegar soluciones de traducción automática de alta calidad sin gastos exorbitantes.

2. Adaptabilidad: Los modelos NMT pueden personalizarse rápidamente inyectando datos en un modelo base con varios niveles de adaptación (lo llamamos agresividad ya que el proceso es automatizado por un algoritmo). En Pangeanic, por ejemplo, ofrecemos la capacidad de personalizar modelos en minutos a través de diferentes niveles de inyección de corpus paralelos, asegurando que la traducción resultante se alinee estrechamente con los requisitos específicos del cliente. Esta adaptabilidad es un factor crucial para mantener la relevancia y precisión de las traducciones en diferentes dominios. Los motores adaptados producen exactamente el contenido que los usuarios desean.

3. Salida Controlada: La NMT se destaca en la entrega de resultados controlados, lo que la hace ideal para dominios específicos como el comercio electrónico, el software, la salud e incluso la subtitulación, llena de matices idiomáticos. Mantener una terminología y estilo consistentes es esencial en estos campos. Pueden darse muchos casos de terminología conflictiva entre estos sectores, por lo que tiene mucho sentido mantener motores separados. A pesar de las increíbles capacidades de la inteligencia artificial generativa (GenAI), controlar la terminología y el estilo es esencial para los usuarios a nivel empresarial. La capacidad de la NMT para respetar glosarios y guías de estilo predefinidos asegura que las traducciones cumplan con los estándares requeridos de precisión y coherencia.

4. Verificación Humana: Un flujo de trabajo profesional en la NMT implica la verificación humana de los archivos TMX antes de inyectarlos en motores NMT adaptativos para su reentrenamiento. Este paso es esencial para asegurarse de que el modelo personalizado produzca traducciones de alta calidad que cumplan con los estándares del cliente. La supervisión humana actúa como una salvaguarda contra posibles errores e inconsistencias, mejorando la fiabilidad general del sistema de traducción automática.

Traducción con LLM basada en prompting

La traducción basada en prompting está demostrando ser muy popular. Sin embargo, presenta ventajas y desventajas. La mayor desventaja, en mi opinión, es la falta de control sobre el resultado (y lo digo después de nuestra experiencia al personalizar nuestro modelo ECO LLM 8x7B para traducción).

No debemos olvidar que los LLM son IA Generativa (GenAI), diseñados para ser generativos. En ciencia e ingeniería, estamos acostumbrados a obtener los mismos resultados si aplicamos la misma fórmula. Sin embargo, todos sabemos que hacer la misma pregunta a un LLM no garantiza necesariamente el mismo resultado de traducción. Eso no es un problema para el usuario ocasional o si eres una oficina, una pequeña empresa o simplemente necesitas traducir un correo electrónico. No dejo de sorprenderme de lo fluido que es nuestro ECO LLM al traducir del japonés o árabe al francés, catalán o español, por ejemplo, ¡mucho más fluido que Google! Entonces, la pregunta es: ¿por qué no estamos utilizando la traducción basada en prompting a gran escala?

Retos de la traducción con LLM basada en prompting

Muchas empresas de traducción automática (TA) y sistemas de gestión de traducciones (TMS) están integrando IA Generativa en sus flujos de trabajo. Esta integración ofrece posibilidades emocionantes, pero también presenta sus retos. Según McKinsey: "La fase de luna de miel de la IA generativa (GenAI) ha terminado. Como la mayoría de las organizaciones están descubriendo, es relativamente fácil construir impresionantes pruebas piloto de GenAI, pero convertirlas en capacidades a gran escala es otra historia. La dificultad para hacer ese salto explica en gran medida por qué únicamente el 11 por ciento de las empresas han adoptado GenAI a gran escala."

Vista de la traducción del árabe al inglés de ECO NMT frente a la traducción por LLM basada en prompting de ECO LLM

He elegido una traducción al inglés para que la mayoría de la gente pueda juzgar las sutiles diferencias.

كما يناقشان كيفية مواجهة الرؤساء التنفيذيين للتحديات الجيوسياسية المتغيرة، وتأثير الذكاء الاصطناعي التوليدي داخل المؤسسات، وكيفية الانتقال نحو استخدام الطاقة المستدامة، بالإضافة إلى ذلك، نستعرض في عدد هذا الشهر مجموعة من الموضوعات البارزة الأخرى التي تدور حول:
كيف تستطيع المؤسسات في مجال التصنيع الاستفادة من الإمكانات الهائلة لتقنيات الذكاء الاصطناعي.

دور المدراء الماليون المهم في تحويل استراتيجيات الشركات من أجل تعزيز قيمتها وخلق فائدة أكبر لها.
استراتيجيات وتقنيات يمكن لمديري عمليات الاستحواذ على صناديق الأسهم الخاصة استخدامها لزيادة القيمة التشغيلية للشركات التي يستحوذون عليها.

أولويات الرؤساء التنفيذيون لتحقيق التميز والريادة خلال فترة قيادتهم.

They also discuss how CEOs face changing geopolitical challenges, and the impact of generative AI within organizations, How to move towards sustainable energy use, In addition, In this month's issue, we will cover a range of other high-profile topics that revolve around:

How can manufacturing organizations take advantage of the enormous potential of AI technologies?

The important role of financial managers in transforming corporate strategies in order to enhance their value and create greater utility for them.

Strategies and techniques that private equity fund acquisition managers can use to increase the operational value of the companies they acquire.

CEO priorities for achieving excellence and leadership during their leadership period.

كما يناقشان كيفية مواجهة الرؤساء التنفيذيين للتحديات الجيوسياسية المتغيرة، وتأثير الذكاء الاصطناعي التوليدي داخل المؤسسات، وكيفية الانتقال نحو استخدام الطاقة المستدامة، بالإضافة إلى ذلك، نستعرض في عدد هذا الشهر مجموعة من الموضوعات البارزة الأخرى التي تدور حول:
كيف تستطيع المؤسسات في مجال التصنيع الاستفادة من الإمكانات الهائلة لتقنيات الذكاء الاصطناعي.
دور المدراء الماليون المهم في تحويل استراتيجيات الشركات من أجل تعزيز قيمتها وخلق فائدة أكبر لها.
استراتيجيات وتقنيات يمكن لمديري عمليات الاستحواذ على صناديق الأسهم الخاصة استخدامها لزيادة القيمة التشغيلية للشركات التي يستحوذون عليها.

أولويات الرؤساء التنفيذيون لتحقيق التميز والريادة خلال فترة قيادتهم

As they discuss how to address the changing geopolitical challenges, the impact of generative AI within institutions, and the transition towards sustainable energy, we will also explore other prominent topics in this month's issue, including:

How manufacturing companies can leverage the immense opportunities provided by AI technologies.

The crucial role of financial managers in translating corporate strategies to enhance a company's value and create greater benefits for it.

Strategies and techniques that corporate raiders can use to increase the operational value of the companies they take over.

Priorities of executives to achieve distinction and leadership during their tenure.

Esa es exactamente la encrucijada a la que se enfrenta la industria de la traducción. Aunque resulta relativamente sencillo utilizar ChatGPT para la traducción, resulta mucho más complicado hacerlo a gran escala cuando entran en juego otros factores. La GenAI, a pesar de su potencial para una mayor automatización, no siempre garantiza la personalización y la coherencia requeridas para las traducciones profesionales. Las empresas están experimentando con GenAI, pero su implementación aún está en evolución. He aquí algunas desventajas (pero no se preocupe: las ventajas vienen a continuación):

1. Falta de Control: Falta de control: Uno de los retos más significativos al utilizar LLMs para la traducción basada en prompting es la falta de control sobre la salida. A diferencia de la NMT, que proporciona resultados consistentes cuando se utilizan los mismos inputs, los LLMs, al tratarase de IA generativa, pueden producir traducciones distintas para los mismos inputs sin ninguna razón en particular. Esta impredecibilidad puede ser problemática para los proyectos de traducción a gran escala que requieren coherencia terminológica.

2. Naturaleza Generativa: Naturaleza generativa: Los LLMs están diseñados para ser generativos, lo cual significa que pueden crear salidas variadas que quizás no siempre coincidan con los requisitos de terminología y guías de estilo. Por ejemplo, en tareas de traducción profesional que exigen un estricto cumplimiento con terminologías específicas y una coherencia de estilo, los LLMs pueden tener dificultades para producir la coherencia deseada.

3. Casos de Uso: Si bien los LLMs destacan por generar traducciones fluidas para necesidades informales o a pequeña escala, su eficacia disminuye para traducciones cohrentes a gran escala. Son adecuados para traducir correos electrónicos, conversaciones informales o documentos puntuales, pero pueden no rendir bien cuando resultan cruciales la terminología precisa y la coherencia de estilo. Asegurar la coherencia segmento tras segmento es un reto: el LLM parece tener una mente propia, aburriéndose con las tareas repetitivas. Por ninguna razón en particular, puede comenzar repentinamente a "generar".

El potencial de la traducción basada en LLM

Implementar tecnologías de traducción automática siempre ha requerido una comprensión sólida del punto de partida (flujos de trabajo basados en memorias de traducción) y del objetivo final. Lo mismo ocurre al pasar de la traducción automática neuronal a la traducción basada en LLM. Debemos ser conscientes de las capacidades actuales y el potencial futuro. Quizás la doble utilización sea una opción, aprovechando las fortalezas de la traducción automática neuronal mientras se exploran las posibilidades de la IA generativa. La industria de la localización, no conocida por su adopción temprana de muchas tecnologías, debe continuar entregando traducciones de alta calidad y personalizadas que satisfagan las demandas cambiantes de la comunicación global.

Sí, el enfoque de traducción basada en prompting utilizando grandes modelos lingüísticos (LLMs) ofrece traducciones más naturales y relevantes en contexto que la traducción automática neuronal (NMT), especialmente cuando los datos de entrenamiento específicos del dominio son limitados o inexistentes. La traducción basada en LLM es ideal para idiomas como japonés <> español o polaco <> mandarín, de forma espontánea. En efecto, veo el valor aquí (dejando de lado el uso de inglés como idioma pivote y obteniendo traducciones culturalmente relevantes).

La cuestión es... ¿hasta cuándo seguiremos utilizando la NMT? No será por mucho tiempo, me atrevo a decir. La inversión y los presupuestos de inversión están en la IA generativa privada, a pesar de que solo el 11% de todas las pruebas de concepto y proyectos se conviertan en implementaciones exitosas, según McKinsey. Por lo tanto, vislumbro sistemas de IA generativa que, a un costo similar o incluso superior, ofrezcan mucha más automatización a través de una única conexión API, aprovechando la fluidez y la revisión y edición en contexto a gran escala de la IA generativa.

Para tareas especializadas, los LLMs entrenados de forma personalizada pueden proporcionar traducciones de alta calidad. Sin embargo, lograr esto requiere técnicas sofisticadas de prompting y flujos de trabajo probados, y a menudo, importantes recursos computacionales. Sin estos, los LLMs pueden producir traducciones demasiado libres que carezcan de la precisión y la exactitud requeridas por los traductores profesionales.

Perspectivas futuras: Cambiando de la traducción automática neuronal (NMT) a la traducción basada en prompting utilizando LLMs

Nos puede gustar o no, pero es posible que la industria vaya migrando gradualmente de la NMT a la IA generativa a medida que mejoren sus capacidades. La IA generativa promete mayores niveles de automatización, fluidez contextual y la capacidad de manejar tareas de traducción complejas a través de una única conexión API. Desde mi punto de vista, la capacidad de proporcionar fluidez contextual es el punto más importante para empezar a considerar la adopción de la traducción basada en prompting utilizando LLMs.

Conclusión

El futuro de la traducción automática personalizada es brillante, ya que tanto la traducción neuronal como el GenAI ofrecen ventajas únicas. Si bien la traducción neuronal lidera actualmente en términos de control, coherencia y rentabilidad, el GenAI promete traducciones más naturales y contextualmente relevantes. A medida que la industria continúe innovando, el equilibrio entre la traducción neuronal y el GenAI dará forma al futuro de los servicios de traducción profesionales. Al mantenerse informados sobre estas tecnologías y sus capacidades en constante evolución, los profesionales de la traducción pueden tomar las decisiones informadas que mejor satisfagan las necesidades de sus clientes.

¿Está pensando en transicionar de su NMT actual a GenAI? Trace su propio destino con Pangeanic. Póngase en contacto con nosotros para explorar cómo estamos implementando la posedición automática basada en GenAI en la Agencia de Noticias EFE.

Ver post completo