PangeaMT Masker
Featured Image

4 lecture des minutes

03/09/2024

L'IA lit le texte pour découvrir des informations à votre place

Dans la première d'une série d'entretiens avec l'équipe clé de R&D et de produits technologiques de Pangeanic, nous découvrons les opinions "internes" de nos développeurs et visionnaires en tant qu'experts.

Dans cette interview, nous parlons à Manuel Herranz, PDG de la société, pour nous présenter certains des nouveaux développements en cours.

Manuel, quelles sont les innovations sur lesquelles vous travaillez en TAL ?

Il y a un réel avantage à travailler dans le Traitement Automatique du Langage naturel (TAL), c'est le fait que le domaine est très vaste. Je dirais que l'IA touche à des domaines "très humains" que nous connaissons tous : le langage, sa signification, la résolution de ses ambiguïtés et de ses polysémies dans la traduction automatique, l'écoute et l'assistance via des assistants personnels... Cependant, de nombreux défis subsistent.

Notre mission est de combiner l'intelligence humaine et la technologie afin que les gens puissent extraire des informations des données d'une manière qui leur serait autrement impossible. La traduction automatique, sous toutes ses formes, est un défi que nous considérons avoir pratiquement résolu et où les utilisateurs peuvent réentraîner leurs machines et créer leurs propres "fermes" de traduction privées.

Maintenant, la question est : que faisons-nous de toutes ces informations ? Nous devons rechercher et identifier des acteurs, des lieux, des dates et peut-être même des actions (verbes) et des combinaisons entre eux. Nous voulons que notre IA soit capable de lire le texte pour découvrir des informations que les humains n'ont pas le temps de lire ou de traiter, ce qui inclut, par exemple, la découverte de liens pour des groupes d'agents des forces de l'ordre, d'avocats, de détectives ou d'économistes.

Pourquoi est-ce important et quel impact cela a-t-il sur la société ?

Le TAL est, à la base, un ensemble d'algorithmes d'apprentissage automatique qui comprennent et même écrivent du texte.

Comme je l'ai déjà dit, pour moi, c'est l'un des domaines de recherche les plus passionnants au sein de l'IA. C'est là que tout se passe, et nous nous dirigeons vers un avenir où l'intelligence artificielle pour le texte (et la voix) sera disponible comme un service qui accélérera l'adoption de la technologie.

Chaque jour, sans exception, nous sommes confrontés à des centaines d'informations que nous ne pouvons plus traiter. Lorsque ces informations doivent être examinées méticuleusement, les ressources humaines et les compétences sont limitées, et l'une de nos principales contraintes est le temps.

Nous travaillons à résoudre ce défi :

Des moteurs de TAL avec des modèles qui peuvent lire et résumer de longs textes, extraire des concepts clés, reconnaître et identifier des personnes qui pourraient être mentionnées, et identifier des modèles et des structures que les lecteurs humains pourraient manquer.

Tout cela a ce que j'appelle des implications de 2e, 3e et 4e degrés.

Implications imprévues : nous pourrons savoir de quoi parle un texte, un document, un rapport, etc., dans une langue étrangère sans avoir besoin de le traduire (la machine le fera comme un processus interne). En outre, il sera possible d'extraire des liens entre les personnes et les faits de manière plus rapide.

Cela peut avoir des répercussions rapides dans les milieux juridiques, comme une meilleure compréhension des preuves médico-légales, mais aussi dans le renseignement policier, par exemple.

Cela peut également nous permettre de "comprendre" de grandes quantités d'informations de notre passé. L'Europe est très riche en dépôts historiques, archives et bibliothèques, et il nous faudrait 100 vies pour lire et comprendre tout leur contenu. Prenons comme exemple l'Archive des Indes à Séville, toute la documentation de trois siècles de présence espagnole sur le continent américain. Il y a beaucoup d'informations croisées à explorer.

Dans certains projets européens, nous travaillons à récupérer la mémoire historique du peuple juif, par exemple.

En parlant des implications de troisième et quatrième degrés, imaginons des processus judiciaires où les preuves sont disponibles pour les procureurs et les parties beaucoup plus rapidement et avec, disons, des métriques "industrielles". Ces processus judiciaires plus lents peuvent devenir des processus plus agiles, ce qui a un impact sur la qualité de vie des citoyens. L'IA, et en son sein le TAL, sont là pour rendre nos vies plus faciles et meilleures.

Pouvez-vous nous donner d'autres exemples plus concrets ?

Bien sûr. Au-delà du domaine du renseignement ou du domaine juridique, une entreprise de ressources humaines peut prétraiter les CV dans d'autres langues, même en extrayant des informations clés, soit avec des mots, soit avec de courts résumés. Une entreprise financière pourrait également utiliser ECO pour comprendre d'énormes quantités de fichiers réglementaires en chinois ou japonais, avec leurs résumés respectifs.

L'objectif serait d'identifier les risques potentiels pour les entreprises qui ont une exposition au marché chinois, et je peux penser à beaucoup...

Je ne peux pas révéler plus sur notre travail, mais il n'est pas surprenant que nous ayons des modèles pré-entraînés et que nous travaillions également avec des clients pour personnaliser les modèles pour des tâches spécifiques ou des ensembles de données spécifiques.

Nous sommes au milieu d'une révolution avec le traitement du langage naturel en ce moment, et cela signifie qu'un grand nombre des tâches de lecture et d'écriture qui nous occupent encore en tant qu'humains vont pouvoir être effectuées par des machines à notre avantage.

Quels autres domaines sont importants dans votre développement ?

L'analyse des sentiments..

Si nous associons tout ce qui précède à une note positive ou négative, l'information résumée devient très puissante. Croisons les données des déclarations, par exemple, avec les investissements en actions d'une certaine personne, et trouvons le sentiment et la tendance positifs ou négatifs d'une action cotée. Les paroles ou les actes de certaines personnes peuvent avoir une très grande pertinence sur les marchés boursiers.

Avez-vous des derniers mots, Manuel ?

Nous allons assister à une nouvelle forme d'intelligence, de relations et de comportement, à une nouvelle intelligence et à de nouvelles perspectives, à une vitesse et à une échelle qui jusqu'à présent n'étaient ni possibles ni accessibles pour nous, simplement parce que nous ne pouvions ni lire suffisamment ni trouver les relations profondes.