Pruebe nuestro LLM Masker
Pruebe nuestro LLM Masker
Featured Image

6 minutos de lectura

31/01/2022

ECO de Pangeanic: una misión para traducir y anonimizar todo el texto del mundo

La importancia de la traducción entre idiomas se refleja en abundantes aplicaciones del día a día; desde el mero entretenimiento a servicios de e-commerce y aplicaciones mucho más sensibles y complejas de importancia jurídica, médica, política o industrial. Un buen ejemplo de ello es la reciente traducción de la popular serie El Juego del calamar, número uno en visualizaciones de Netflix, la cual ha recibido críticas por un deficiente uso de la tecnología y revisión humana en sus subtítulos.

Numerosos medios, entre otros un artículo de Fotogramas sobre sus enormes errores de traducción, demuestran cómo se ha perdido el sentido casi total del guion original en la traducción de los subtítulos al inglés. La clave se ubica en el íntimo vínculo entre las personas y la confianza en los datos que producen las máquinas de traducción, es decir, las expectativas y las habilidades humanas a la hora de utilizar la tecnología eficientemente. También existe un nexo entre el uso visible y los sistemas gratuitos.

Las nuevas formas híbridas de traducción se valen de las tecnologías más pioneras, como el aprendizaje automático y el aprendizaje profundo, para ofrecer una nueva generación de sistemas adaptativos que cierren la brecha con la paridad humana.

 

ECO: una nueva forma de traducción automática adaptativa profunda

Los hechos demuestran que lo que no es escalable no es sostenible, y los métodos tradicionales de traducción humana o con herramientas TAO (Traducción asistida por ordenador, sistemas basados en memorias de traducción) son incapaces de abordar la escalabilidad en la calidad humana de las traducciones. A raíz de este problema, nace la plataforma de traducción de documentos en nube privada ECO, y su posterior v2 logra combinar inteligencia humana con tecnología de traducción automática de vanguardia.

La plataforma ofrece una nueva forma de traducción automática adaptable que presenta motores cognitivos personalizados. Con base en sistemas de inteligencia artificial (IA), consigue imitar la terminología y el estilo de los usuarios en cuestión de minutos o incluso en tiempo real; creando motores de traducción cuyos resultados ofrecen una calidad cercana a la paridad humana.

La plataforma implementa traducciones de la más alta calidad, técnicas de anonimización y seguridad de nivel empresarial, ya sea en las instalaciones de los clientes o desde la nube privada de servidores de Pangeanic. A continuación, le contamos cómo pretendemos llevar a cabo nuestra misión, combinando la inteligencia artificial y la humana para traducir o anonimizar todo tipo de contenido con ECO.

 

 

 

¿Cómo traducir todo tipo de contenidos con la plataforma ECO?

La plataforma ECO de Pangeanic puede traducir documentos, archivos de Excel, archivos de PowerPoint, términos y condiciones, catálogos de productos, correos electrónicos, conversaciones, subtítulos y cualquier otro contenido imaginable. Además, los servicios de anonimización ayudan a las organizaciones a compartir información de la forma más segura y a cumplir con las leyes de privacidad.

Tanto si se busca un servicio de traducción rápido, un sistema de anonimización independiente o un servicio recurrente de traducción y anonimización en SaaS (Software as a service), el ecosistema de Procesamiento del Lenguaje Natural (PLN) de ECO permite a los clientes elegir un solo proceso de lenguaje o integrarlos todos. ECO está disponible en paquetes de suscripción mensuales disponibles según necesidades de empresas pequeñas, medias o corporativas.

La traducción automática a través de una API es instantánea y ECO automatiza los flujos de trabajo para que ni usuarios ni Pangeanic deban invertir su tiempo en gestión. Todos los pasos siguientes son autoseleccionables por parte del usuario e incluso programables para mayor eficiencia en la transferencia de contenidos.

  • Petición (query): La petición de traducción automática del documento o fragmento de texto, con o sin anonimización. El usuario sube los documentos desde su máquina local a la plataforma y selecciona las opciones. Los usuarios avanzados o corporativos pueden escoger enviar lotes programáticamente, con autoidentificación y encriptación entre los sistemas para el envío constante de información. 
  • Análisis de similitud (opcional): El primer paso consiste en comparar si existen frases previamente traducidas y revisadas por humanos para mantener el estilo, terminología y ahorrar coste al usuario. Se verifica la memoria de traducción del cliente y se extraen coincidencias y similitudes entre traducciones anteriores.
  • Traducción automática adaptada o traducción automática genérica /anonimización: ECO escoge el mejor motor de traducción especializado analizando el tipo de contenido entrante, o el motor de traducción del cliente que ha sido previamente adaptado para el cliente. En el caso de la anonimización, se elige el idioma y máquina especializada en su caso. El proceso de anonimización puede ser previo a la traducción para cumplir con requisitos de privacidad o único (sin traducción).
  • Edición humana del contenido (opcional): Si el contenido a traducir tiene como destino su publicación, es decir, está dirigido a audiencias o público que lo leerá, recomendamos una revisión por parte de nuestros editores humanos, los cuales son seleccionados en base a calificación previa, experiencia en el tema y disponibilidad. Llamamos a este paso “humano en el proceso” (del inglés human-in-the-loop) y es un paso completamente opcional. Cuando el contenido no es esencial (revisiones, comentarios u opiniones en la web, documentos puramente informativos, información sobre patentes, comprender noticias, etc.), no es óptimo ni escalable. Si se produce una revisión humana, esta se guarda en la memoria de traducción del cliente y se aplicaría en el Paso 2 en futuros trabajos.
  • Evaluación de la calidad y resultado final: ECO produce métricas de calidad recogidas en cada una de las fases del proceso de traducción, incluyendo reglas tanto generales como específicas a los requisitos de cada cliente. La combinación de tecnologías permite que el resultado final sea una traducción de calidad casi perfecta (cercana a la paridad humana). Estas evaluaciones forman parte de las métricas de calidad y consumo y están a disposición de los clientes en su perfil.
  • Envío automático (API o descarga): Los documentos se envían según el requisito del cliente, de modo automático a través de la API de traducción o mediante descarga privada desde el perfil del usuario.

 

traducción automática

 

Red de autoaprendizaje de ECO

La magia en el proceso de ECO es que cuanto más traduce, mejores son los resultados del sistema. Según la plataforma va conociendo las preferencias de su cliente, las memorias de traducción van ampliándose y mejoran los motores de traducción para perfeccionarlos y acercarlos cada vez más a la paridad humana. Si el cliente no utiliza este paso, siempre puede aportar datos o apuntar a fuentes de datos para que Pangeanic realice ese trabajo de minería y especialice el motor.

Gracias al aprendizaje automático, que permite más y más precisión de contexto y especialización conforme va familiarizándose con los textos de una determinada fuente, las organizaciones y empresas que contratan la traducción y anonimización como SaaS encuentran en Pangeanic un socio tecnológico que les ofrece recursos de traducción altamente sofisticados y escalables.

 

eco

ECO: el equilibrio entre inteligencia humana y el Procesamiento del Lenguaje Natural aplicado a la traducción

La demanda de traducciones profesionales crece exponencialmente. Los sistemas de comunicación de las grandes empresas necesitan conocer las opiniones de sus usuarios, las cuales se realizan de modo conversacional en múltiples idiomas. Las fuentes de información originales son múltiples y no necesariamente suceden en un idioma familiar. El sistema fragmentado de producción artesanal que ofrecen las miles de agencias de traducción de todo el mundo ya ha quedado obsoleto. Pangeanic identificó esta necesidad y cambió su misión para convertirse en una empresa de tecnología de Procesamiento del Lenguaje Natural, enfocándose en la generación de la traducción automática más avanzada y sistemas de apoyo como la anonimización. Nuestra misión y visión fueron respaldadas con varios proyectos realizados para la Comisión Europea (MAPA-project.eu para anonimización, NEC-TM para memorias de traducción, NTEU para motores de traducción). Cada proyecto ha sido un paso en nuestro crecimiento y desarrollo y finalmente se ha materializado en la satisfacción de clientes y usuarios en todo el mundo.

Como explica a PR Newswire el consejero delegado de Pangeanic; los procesos de IA de ECO ayudan a aumentar la productividad, obtener conocimientos de los datos, reducir costes y simplificar la administración de contenido en las empresas. Todo esto cumpliendo siempre con los altos estándares de seguridad y privacidad.

De esta forma, ECO cumple con nuestra misión en la combinación de la inteligencia artificial y la humana para obtener información accionable gracias a sus soluciones de traducción automática neuronal casi humana, con motores de traducción y aprendizaje profundo que comprenden el contexto circundante en tono, estilo y terminología, y que detectan los actores y entidades en caso de necesidad para automatizar la anonimización y cumplir con los reglamentos de privacidad de distintas jurisdicciones.

Creemos en la automatización de procesos y que, en muchos escenarios, la tecnología de traducción automática de Pangeanic realiza un trabajo a precio y rapidez que un servicio de traducción tradicional no puede. En algunos casos, la aportación del “toque humano” sigue siendo necesario, con la diferencia de que nuestro enfoque está dirigido a corregir y editar el trabajo de la IA que mejora con el uso en lugar de asumir la traducción en su globalidad. Enseñamos a las máquinas el lenguaje humano recolectando millones de frases paralelas entre idiomas. De esta forma, favorecemos procesos escalables, tanto en calidad como en precisión y privacidad. 

ml area

 

 

ECO by Pangeanic: motores híbridos de traducción con calidad casi humana

ECO se ha convertido en el traductor de documentos con solución de anonimización por excelencia, basado en el aprendizaje profundo y la traducción automática. Ofrece motores de traducción para implementación local o sistemas completos de traducción automática, según las necesidades de cada cliente.

Como herramienta SaaS de traducción y anonimización, ofrecemos soluciones a clientes de sectores tan diversos como el sector farmacéutico, de la salud, bancario y financiero entre muchos otros. Si busca un aliado clave para el control del contenido y la reputación digital ¡ECO es su solución!

 

cta contacto