PangeaMT Masker
PangeaMT Masker
Featured Image

3 lettura minuti

03/09/2024

L'IA leggerà i testi per scoprire informazioni per te.

Nel primo di una serie di interviste con il team chiave di ricerca e sviluppo e prodotto tecnologico di Pangeanic, scopriamo le opinioni "interne" dei nostri sviluppatori e visionari in qualità di esperti.

In questa intervista, parliamo con Manuel Herranz, CEO dell'azienda, per discutere di alcuni dei nuovi sviluppi su cui si sta lavorando.

Manuel, quali sono le innovazioni su cui state lavorando nell'NLP?

C'è un aspetto davvero positivo nel lavorare nell'elaborazione del Linguaggio Naturale, ed è il fatto che il campo è molto vasto. Direi che l'IA tocca aree "molto umane" con cui siamo tutti familiari: il linguaggio, il suo significato, il tentativo di risolvere le sue ambiguità e polisemie nella traduzione automatica, l'ascolto e l'assistenza attraverso assistenti personali... Tuttavia, rimangono molte sfide.

La nostra missione è combinare l'intelligenza umana e la tecnologia in modo che le persone possano estrarre informazioni dai dati in un modo che altrimenti non potrebbero. La traduzione automatica, in tutte le sue forme, è una sfida che riteniamo di aver praticamente risolto e in cui gli utenti possono riqualificare le loro macchine e creare le proprie "farm" di traduzione private.

Ora, la domanda è: cosa facciamo con tutte quelle informazioni? Dobbiamo cercare e identificare attori, luoghi, date e forse anche azioni (verbi) e combinazioni tra di loro. Vogliamo che la nostra IA sia in grado di leggere il testo per scoprire informazioni che gli esseri umani non hanno il tempo di leggere o elaborare, e questo include, ad esempio, scoprire collegamenti per gruppi di agenti delle forze dell'ordine, avvocati, investigatori o economisti.

Perché questo è importante e che impatto ha sulla società?

L'NLP è, nel suo nucleo, un insieme di algoritmi di machine learning che comprendono e persino scrivono testo.

Come ho detto prima, per me, è una delle aree di ricerca più entusiasmanti all'interno dell'IA. È qui che sta accadendo tutto, e ci stiamo dirigendo verso un futuro in cui l'intelligenza artificiale per il testo (e la voce) sarà disponibile come servizio che accelererà l'adozione della tecnologia.

Ogni giorno, senza eccezione, siamo confrontati con centinaia di informazioni che non possiamo più elaborare. Quando queste informazioni devono essere esaminate meticolosamente, le risorse umane e le competenze sono limitate e uno dei nostri maggiori vincoli è il tempo.

Stiamo lavorando per risolvere questa sfida:

Motori NLP con modelli che possono leggere e riassumere lunghi corpi di testo, estrarre concetti chiave, riconoscere e identificare le persone che potrebbero essere menzionate e identificare modelli e strutture che i lettori umani potrebbero non notare.

Tutto questo ha, quello che chiamo, implicazioni di secondo, terzo e quarto grado.

Implicazioni impreviste: saremo in grado di sapere di cosa tratta un testo, un documento, una relazione, ecc., in una lingua straniera senza la necessità di tradurlo (la macchina lo farà come processo interno). Inoltre, sarà possibile estrarre collegamenti tra persone e fatti in modo più rapido.

Questo può avere rapide ripercussioni negli ambienti legali, come una migliore comprensione delle prove forensi, ma anche nell'intelligence della polizia, per esempio.

Può anche permetterci di "comprendere" grandi quantità di informazioni dal nostro passato. L'Europa è molto ricca di depositi storici, archivi e biblioteche e ci vorrebbero 100 vite per leggere e comprendere tutti i loro contenuti. Prendiamo come esempio l'Archivio delle Indie a Siviglia, tutta la documentazione di tre secoli di presenza spagnola sul continente americano. C'è una grande quantità di informazioni incrociate da esplorare.

In alcuni progetti europei, stiamo lavorando per recuperare la memoria storica del popolo ebraico, per esempio.

Parlando delle implicazioni di terzo e quarto grado, immaginiamo processi giudiziari in cui le prove sono disponibili ai pubblici ministeri e alle parti molto più velocemente e con, diciamo, metriche "industriali". Questi processi giudiziari più lenti possono diventare processi più agili, il che ha un impatto sulla qualità della vita dei cittadini. L'IA, e al suo interno l'NLP, sono qui per rendere la nostra vita più facile e migliore.

Può darci altri esempi più concreti?

Certamente. Al di là dell'intelligence o del campo legale, un'azienda di risorse umane può pre-elaborare CV in altre lingue, estraendo anche informazioni chiave, sia con parole che con brevi abstract. Una società finanziaria potrebbe anche utilizzare ECO per comprendere enormi quantità di file normativi in cinese o giapponese, con i rispettivi abstract.

L'obiettivo sarebbe quello di identificare i rischi potenziali per quelle aziende che hanno esposizione al mercato cinese, e posso pensare a molti...

Non posso rivelare di più sul nostro lavoro, ma non sorprende che avremo modelli pre-addestrati e lavoreremo anche con i clienti per personalizzare i modelli per compiti specifici o set di dati specifici.

WSiamo in mezzo a una rivoluzione con l'elaborazione del linguaggio naturale al momento e questo significa che un gran numero dei compiti di lettura e scrittura che ancora ci occupano come esseri umani potranno essere eseguiti da macchine a nostro vantaggio.

Quali altre aree sono importanti nel vostro sviluppo?

L'analisi del sentiment..

Se accoppiamo tutto quanto sopra a una valutazione positiva o negativa, le informazioni sommate diventano molto potenti. Incrociamo i dati delle dichiarazioni, ad esempio, con gli investimenti azionari di una certa persona e troviamo il sentiment positivo o negativo e la tendenza di un titolo quotato. Le parole o le azioni di certe persone possono avere un'alta rilevanza nei mercati azionari.

Ha qualche parola finale, Manuel?

Stiamo per assistere a una nuova forma di intelligenza, relazioni e comportamenti, nuove intelligenze e intuizioni, ad una velocità e scala che fino ad ora non erano né possibili né accessibili a noi, semplicemente perché non potevamo né leggere abbastanza né trovare le relazioni profonde.