PangeaMT : en tête des solutions de développement de la traduction automatique

Rédigé par M.Ángeles García | 05/21/24

Nous sommes fiers de vous présenter PangeaMT, la division technologique et hub d'innovation de l'entreprise, au cœur des solutions de traitement des langues de Pangeanic. C'est dans cette division que sont créés les moteurs de traduction de pointe de Pangeanic.

Comment la division technologique de Pangeanic a-t-elle été fondée?

PangeaMT est à la pointe du développement technologique au sein de Pangeanic. En tant que département technologique, son travail répond à des besoins spécifiques de l'industrie. Cette division bénéficie de plus de dix ans d'expérience et de connaissances en matière de traduction automatique acquises auprès de Manuel Herranz, CEO de Pangeanic.   "En 2008, nous avons collaboré avec l'Université polytechnique de Valence et plusieurs autres universités européennes pour trouver des solutions pour nos clients, avec un accent particulier sur le secteur de l'automobile et de l'électronique professionnelle. À cette époque, des masses de documents accompagnaient les machines - des manuels d'utilisation techniques et autres, qui utilisaient un "langage contrôlé". C'est-à-dire, un langage sans fioritures, clair, et des termes et expressions faciles à comprendre."  - Manuel Herranz
De nouvelles collaborations pour la reconnaissance de modèles de langage statistique ont suivi, et une division spécifiquement consacrée au développement technologique a été créée.  Grâce à la mathématique statistique appliquée au langage, Pangeanic est devenue l'une des rares entreprises mondiales à utiliser la TAM (traduction automatique statistique) pour produire plus rapidement et avec succès des publications dans des langues aux syntaxes similaires.  De 2010 à 2015, PangeaMT a atteint une autre étape importante en formant un partenariat avec le japonais Toshiba. Des moteurs hybrides ont été construits dans le cadre de cette collaboration, dans le but de résoudre les problèmes de langues étrangères, compte tenu des limitations statistiques à l'époque.  Depuis lors, PangeaMT a grandi et évolué, stimulant l'innovation dans l'industrie. Continuez à lire pour en savoir plus sur les cas d'utilisation et les technologies qui font une différence dans l'industrie.

 

Comment la traduction automatique et les réseaux neuronaux ont facilité la circulation de l'information pendant la pandémie

Un défi majeur auquel est confrontée la traduction automatique est l'acquisition de données de qualité pour l'entraînement. Pour construire des moteurs hyper-spécialisés, de grandes quantités de connaissances et de données sont nécessaires pour que l'IA puisse les analyser et en tirer des enseignements. TAUS a fourni à PangeaMT près de 2 millions de mots pour construire des modèles de traduction automatique spécifiques au secteur de la santé. À une époque où la société était la plus touchée par la COVID-19 et que les vaccins étaient en cours, ces solutions personnalisées ont permis la traduction de documents médicaux de l'anglais vers l'espagnol, l'allemand, le polonais, le russe et le chinois. En savoir plus sur ce projet PangeaMT : Traduction automatique adaptative pour TAUS.

Deep Adaptatif, la clé pour que les machines comprennent le langage humain

Manuel Herranz explique ce qu'est Deep Adaptive, la technologie qui révolutionne l'industrie de la traduction automatique : « Deep Adaptive est un moteur de traduction parfaitement adapté aux besoins de chaque client, tout en y apportant ses propres "touches". Grâce à ce processus, le moteur analyse le texte d'entrée et examine son terminologie et ses caractéristiques. Ensuite, il recherche dans notre énorme base de données des matériaux similaires, tout en privilégiant à la fois nos moteurs généraux pour créer une adaptation profonde. » La technologie Deep Adaptive permet aux machines d'effectuer une analyse beaucoup plus approfondie, en faisant correspondre la langue source et cible de manière presque humaine. Nous disons souvent qu'ils comprennent la langue humaine, car ces moteurs ne sont pas limités à la traduction automatique. Au contraire, ils tiennent compte des paramètres qui étaient auparavant exclusivement effectués par des humains. Ces moteurs peuvent identifier l'utilisation stylistique au sein d'une entreprise ou d'une institution, voire le ton et la voix d'une marque. Ils apprennent des données fournies par les humains et créent une boucle d'apprentissage unique pour chaque client. Avec PangeaMT, cette technologie s'applique à différents services NLP (traitement du langage naturel) tels que l'anonymisation, la synthèse, le crawling web, ou la classification de documents et de données. Elle est composée d'une large gamme de solutions et de développements technologiques combinés, générant une puissante base de données pour la formation de l'intelligence artificielle et les processus de gestion de l'information.

Comment pouvons-nous utiliser la technologie Deep Adaptive?

Manuel Herranz donne un exemple des avantages que cette innovation offre aux entreprises de différents secteurs : « L'un de nos clients souhaite surveiller les actualités qui ne sont publiées que sur certains sites Web et dans certaines langues. Une fois que nous avons identifié quelles actualités intéressent ou non ces journalistes, nous effectuons une traduction de haute qualité en espagnol avant de classer les articles par pertinence à l'aide de technologies avancées d'analyse de sentiments. Des mots-clés sont ensuite extraits et l'article est classé dans un domaine spécifique. À partir de là, nos clients peuvent exploiter les informations pour leur analyse et leurs conclusions journalistiques. Nos recherches sont axées sur la création d'un résumé ou d'un abrégé qui vous fournit également une introduction pour vous donner une vue d'ensemble de ce que sont les informations. Ce type de solution est particulièrement pertinent pour les grandes organisations afin qu'elles puissent gérer les connaissances. »

La valeur de la donnée ; l'avenir réside dans sa génération et son analyse

Plongé dans l'ère des Big Data, à une époque où de nombreuses entreprises ont l'occasion de générer de grandes quantités d'informations à traiter, Manuel expose clairement sa position : « Les organisations qui ne sont pas conscientes qu'elles ont un problème de données, ont un problème de big data. La simple collecte de données n'est plus suffisante, la vraie valeur réside dans son analyse , dans les connaissances approfondies qu'elle peut apporter à une organisation. Des informations sur ses utilisateurs, ses clients et sa communauté ; une meilleure analyse de ce qui se passe au sein et autour de votre communauté, la proposition de solutions améliorées répondant aux besoins de votre public et la fidélisation de la clientèle. La capacité à surveiller plusieurs perspectives linguistiques et à extraire des informations réellement pertinentes, cela fait partie d'une analyse en profondeur. Comment nous communiquons, quels que soient les langages, ce que les opinions sur un produit ou un service, quand et comment les gens sont mentionnés dans les textes, tout cela en fait partie. La technologie doit travailler à extraire tous ces paramètres pour une analyse humaine ultérieure, afin que nous puissions prendre de meilleures décisions. « En appliquant des mathématiques avancées, nous pouvons » prédire « les chances qu'un événement se produise, et c'est vraiment précieux. Nous pouvons prédire comment une phrase est dite dans une autre langue, tout en y ajoutant une touche si désirée. Nous pouvons prédire la probabilité de commentaires négatifs suivant, par exemple, le lancement d'un produit, et extraire les pires résultats - vous aidant à déterminer exactement ce qui n'a pas fonctionné ou ce que vos utilisateurs n'aiment pas. Nous pouvons classer les informations à une vitesse à laquelle les humains ne peuvent fonctionner. Cela crée également de nouveaux emplois précieux pour la société, car nous dépendons de plus en plus des informations pour nous rendre meilleurs en tant qu'êtres humains. » Comme Manuel le conclut, la clé réside dans la combinaison puissante de l'intelligence artificielle et humaine.