Le projet d'intelligence artificielle Pangeanic

Mise à jour 2024

Depuis le lancement du projet d'intelligence artificielle Pangeanic, l'entreprise a réalisé des avancées significatives dans le domaine de l'intelligence artificielle (IA), en particulier dans le traitement du langage naturel (NLP) et la traduction automatique. Leurs accomplissements en IA incluent le développement de la plateforme ECO, qui interprète et structure les données provenant de sources non structurées, permettant un traitement fluide des données dans divers systèmes. Cette plateforme facilite les technologies de classification des données, des documents et des e-mails, en surmontant les barrières linguistiques et les défis liés aux données. Les modèles d'IA de Pangeanic permettent aux organisations de traiter efficacement les informations, facilitant ainsi une prise de décision éclairée basée sur des données précises et pertinentes. De plus, Pangeanic offre une gamme de services d'IA tels que la traduction automatique adaptative profonde, la classification de texte et de données, le masquage et l'anonymisation des données, la détection de données personnelles (PII), et la synthèse intégrée. Son célèbre outil d'annotation de données s'appelle PECAT.

Le chatbot IA de Pangeanic, nommé ECOChat, s'intègre parfaitement aux sites web existants en utilisant un LLM personnalisé pour interpréter et structurer les données provenant de sources non structurées. Ces chatbots peuvent être construits avec les données d'un site web en seulement une heure, garantissant un processus de configuration rapide et efficace sans nécessiter de transfert de données à des tiers. En injectant des documents et des rapports privés, les chatbots IA de Pangeanic créent des assistants IA complets qui respectent la confidentialité et permettent de gagner un temps considérable dans la gestion des recherches d'informations internes et externes, des demandes des clients et des requêtes du personnel. De plus, les chatbots IA de Pangeanic utilisent des données publiques pour créer un chatbot de base, permettant aux utilisateurs de contrôler les documents et les PDF avec lesquels le chatbot interagit. Cette intégration permet aux organisations de communiquer avec les utilisateurs, les employés et les clients dans plusieurs langues en utilisant la traduction automatique par IA, économisant ainsi des milliers d'heures d'interactions manuelles. En outre, Pangeanic propose des solutions personnalisées pour la gestion et la traduction des connaissances multilingues, en exploitant les propriétés génératives des grands modèles de langage (LLM) en toute confidentialité.

Pour beaucoup, Google Translate est un solutionneur de problèmes absolu : il suffit de copier-coller et les traductions apparaissent comme par magie.

Cependant, la naïveté et une utilisation inappropriée rendent les applications de traduction en ligne gratuites problématiques.

Les outils en ligne gratuits ne sont qu'une version de démonstration de ce que la technologie peut faire et constituent un excellent moyen de collecter du texte monolingue. De plus, leur capacité de traduction primaire est limitée à une simple langue sélectionnée, après quoi ils pivotent via l'anglais (la traduction du japonais vers l'allemand nécessitera un "pont" à travers une traduction initiale en anglais depuis le japonais, puis de l'anglais vers l'allemand). C'est la magie noire derrière toutes ces combinaisons linguistiques.

Certaines langues ne sont compréhensibles que dans une certaine mesure. Pour les propriétaires d'entreprise qui cherchent à traduire un site web ou qui ont besoin d'énormes quantités de données, le résultat "gratuit" pourrait être plus qu'une mauvaise note dans un cours de langue étrangère. Bien souvent, il n'y a rien de plus regrettable pour un dirigeant ou un représentant effectuant une présentation que de voir ses documents faisant autorité traduits de manière inefficace, ou pire encore, donnant l'impression d'une dépendance totale à la sortie de traduction automatique sans révision humaine.

Les conséquences peuvent être une affaire commerciale compromise ou une solution inappropriée. Pangeanic a lancé son projet de traduction automatique neuronale en 2017 pour atténuer ce risque. Il s'est développé en un projet complet d'intelligence artificielle résolvant les limites des technologies de traitement du langage naturel en appliquant l'IA.

Pangeanic a son siège social à Valence (Espagne) et des bureaux à Madrid et à Londres. L'entreprise a été constituée aux États-Unis en 2019, avec des bureaux principaux à Boston et San Francisco, ainsi qu'une représentation commerciale à Chicago, Miami et Houston. Le fondateur de Pangeanic, Manuel Herranz, a compris qu'à mesure que le monde devient une communauté sociale, le transfert linguistique ne peut pas être résolu par des solutions grand public (Google Translate, Amazon, Bing Translator) en raison de problèmes de confidentialité.

De nombreux contenus textuels générés par les utilisateurs retournent aux générateurs de contenu, affectant la réputation de la marque, les contrats, les litiges internationaux et la documentation entre entreprises, groupes sociaux, réseaux et nations. La nécessité d'un transfert linguistique privé et ultra-rapide reste le principal obstacle. La mission de Pangeanic, à travers sa division technologique PangeaMT, est de développer, mettre en œuvre et utiliser l'innovation de pointe - c'est ce que nous appelons le projet d'intelligence artificielle Pangeanic. L'entreprise s'est fixé pour objectif de déchiffrer d'énormes quantités de données, de vastes dossiers juridiques, de Big Data et de grandes quantités d'informations. PangeaMT, sa division technologique, fournit fréquemment des projets et des infrastructures numériques à la Commission européenne pour la mise en œuvre dans les États membres, comme iADAATPA et NEC TM.

Qu'est-ce que le projet d'intelligence artificielle Pangeanic ?

laptop showing PangeaMT's mission AI-driven Natural Language Processing

Discover Acquire Transmit Organize Knowledge is the Pangeanic Artificial Intelilgence Project

Anonymization, Key Data Extraction, Summarization Machine Translation

Lorsque l'un des moteurs Pangeanic termine le traitement (transfert linguistique), la sortie est améliorée et humanisée selon les normes ISO par des linguistes qualifiés possédant les aptitudes appropriées pour adapter les sorties neuronales de la machine (traduction) à un langage de qualité humaine prêt à être publié. Nous appelons ce processus post-édition, qui peut se produire de deux manières différentes : la post-édition légère ou la post-édition profonde. La post-édition légère fait référence à une intervention humaine corrigeant uniquement les erreurs critiques qui rendraient un texte incompréhensible pour les lecteurs humains. En revanche, la post-édition profonde fait référence à une lecture critique qui corrige toutes les erreurs de la machine et élimine toutes les traces de traduction "littérale" ou "automatique".

Alors, où intervient l'IA ? Alors, où intervient l'IA ? Les machines de Pangeanic apprennent de l'input humain, s'adaptant en temps réel aux préférences humaines. Deux articles académiques ont été le résultat de notre R&D :

En bref, chaque système crée un grand moteur de traduction générique basé sur des corpus parallèles pour les systèmes de traduction automatique auxquels l'apprentissage profond est appliqué. Au fur et à mesure que l'humain corrige les erreurs de la machine ou apporte des modifications, le moteur apprend les préférences de l'humain et crée un "miroir" où toutes ces préférences sont stockées. Le grand moteur générique peut ainsi se spécialiser dans de nombreux domaines, chacun contenant les préférences de chaque utilisateur. D'autres domaines où Pangeanic combine le traitement du langage et l'intelligence artificielle avec des approches similaires sont l'anonymisation, l'extraction de données clés, la catégorisation automatique des textes et la synthèse. Tous ces éléments peuvent être combinés dans des projets et des configurations particulières, et sont disponibles auprès de notre équipe !