Konstantin Dranch, investigador de la industria del lenguaje y fundador de Custom.MT
“Los motores de traducción automática del mundo procesan más textos que los que todos los traductores humanos en la Tierra podrían traducir juntos en 20 años”.
Konstantin comenzó su andadura profesional en la industria de la localización hace 12 años. Su primer trabajo fue en el área de marketing y estrategia de una empresa de tecnología de traducción. Posteriormente trabajó en la compañía MIMS Insights, donde lideraba la dirección de investigación. Ahí trazaba un mapa de la industria, investigando sobre qué tecnologías se utilizaban en el mercado.
Tras esos años comenzó su primer negocio por cuenta propia, centrándose en dar respuestas a las necesidades de traducción y localización que podían tener las empresas en todo el mundo.
En aquel momento, el mercado se centraba en la personalización del modelo de traducción automática. Google y Microsoft trabajaban en la traducción automática para que los motores aprendieran los nombres de los productos y mejoraran el estilo y la precisión de los idiomas, especialmente en contenido científico o de marketing y en todo aquello que las empresas o las organizaciones necesitasen.
Fue entonces cuando Konstantin, junto con un compañero, creó Custom.MT (MT por las siglas en inglés de machine translation, traducción automática). Pero no todos entendieron el concepto; al poco de crear la empresa, recibieron un correo electrónico de las autoridades maltesas preguntando: “¿Por qué estáis usando el dominio de Malta?”.
Desde la creación hasta ahora han pasado dos años y su trabajo se centra en personalizar e implementar diferentes modelos de traducción automática para entornos corporativos.
Manuel Herranz, CEO de Pangeanic, es el encargado de entrevistar a Konstantin Dranch en este tercer podcast de “Pangea AI & Languages”. Preguntado sobre cómo ve la industria de la localización y traducción con respecto a la inteligencia artificial, responde: “La relación entre los traductores y la traducción automática es de amor y odio. Al principio, había mucho miedo a que con la traducción automática los robots reemplazaran a los humanos. Todos se preguntaban qué pasaría. En los comienzos, tal vez el 5-10 % del volumen de traducción correspondía a la traducción automática, pero a medida que la calidad ha mejorado durante los últimos cinco años, los traductores han comenzado a comprender que no necesitan hacer el trabajo desde cero porque puede hacerlo el robot y ellos solo tienen que editarlo”. Para él está claro: “Se gana tiempo y dinero”.
Según las cifras, “los motores de traducción automática del mundo procesan más textos que lo que todos los traductores humanos en la Tierra podrían traducir juntos en 20 años”. Aunque Konstantin reconoce que “en términos económicos, es el traductor humano el que todavía gana todo el dinero; las máquinas representan tal vez el 2 % del mercado en términos de efectivo”.
Para él, hay una clara explicación: “Aún somos reacios al riesgo porque a nadie le gustaría que la descripción de su medicamento la tradujera una máquina sin ninguna revisión humana”.
Konstantin reconoce que en este escenario de crecimiento vertiginoso de la traducción automática “se debe confiar porque no hay otra opción. Todos están haciendo diferentes pronósticos de modelos predictivos para ver si se puede confiar en la traducción automática, no solo a nivel humano sino también a nivel algorítmico”.
Los propios gobiernos están adoptando activamente la traducción automática. “En Canadá hay un ministerio de Traducción y utilizaron la traducción automática con un idioma indígena con el fin de protegerlo”.
La traducción automática como vía para la protección de lenguas en peligro de extinción
La traducción automática está sirviendo como tecnología para preservar los idiomas en peligro de extinción. Konstantin opinó sobre si creía que se podría producir contenido con la misma calidad que los traductores humanos, por ejemplo, cuando se trata de expresiones idiomáticas, subtítulos de películas, literatura y otros géneros creativos: “Es una discusión en curso porque la oportunidad económica de hacer un motor de traducción automática para idiomas minoritarios no es muy grande. ¿Por qué gastar un millón de dólares en algo que no dará ningún retorno?”.
Según los datos que maneja Konstantin, “por el momento, Google cubre 135 idiomas. Facebook lanzó recientemente un modelo de código abierto que cubre 200. Pero ¿cuántos idiomas hay en la Tierra? Seis mil idiomas, aproximadamente”.
Para él está claro que las marcas no invierten en un idioma que tenga muy pocos hablantes. “Las compañías están tratando de resolverlo teniendo modelos multilingües que entienden un idioma, incluso aunque la calidad no sea excelente”.
La industria lingüística europea en 2022 ha realizado una encuesta en la que reconoce que el 65 % de las empresas de esta industria consideran que existe la posibilidad de mejorar la calidad de la traducción automática neuronal.
Konstantin reconoce las amplias oportunidades que ofrece la traducción automática neuronal a empresas y administraciones públicas que desean motores personalizados: “Estos datos son altamente científicos y especializados porque los clientes son exigentes y solicitan controles de calidad, revisiones, etc. En algunos casos las empresas de traducción son dueñas de los datos, y en otros, son los clientes los que los poseen”.
Custom.MT, centrada en un proyecto de traducción automática en el ámbito del cambio climático
Konstantin explica que Custom.MT trabaja en implementar diferentes tipos de inteligencia artificial en el campo de la traducción automática: “Entrenamos diferentes modelos, los comparamos, ejecutamos las evaluaciones y ayudamos a nuestros clientes. Estamos desarrollando mucho software para implementar esos modelos ya preparados directamente en las aplicaciones que las personas usan, sin que sea necesario que vean la traducción automática”.
Uno de los proyectos en los que están centrados actualmente es lo que llaman “traductor de cambio climático”. Gracias a la colaboración con una importante organización de cambio climático pudieron obtener sus datos. “Queremos analizar mucho más y poder hacer el motor de traducción automática más preciso del mundo para ayudar a promover información sobre el cambio climático en diferentes idiomas.
Hoy en día, mucha información sobre el cambio climático sale a la luz con una calidad increíble, pero tiene un alcance muy limitado. Nuestro objetivo es que pueda ser indexada por Google y transformada en 40, 50 o 100 idiomas, con alta precisión y sin la necesidad de utilizar un millón de traductores”.