PangeaMT Masker
Featured Image

3 min read

05/09/2024

A IA lerá o texto para descobrir informações para você

Na primeira de uma série de entrevistas com a principal equipe de P&D e produtos tecnológicos da Pangeanic, descobrimos as opiniões "internas" de nossos desenvolvedores e visionários como especialistas.

Nesta entrevista, conversamos com Manuel Herranz, CEO da empresa, para nos falar sobre alguns dos novos desenvolvimentos em que estão trabalhando.

Manuel, quais são as inovações em que você está trabalhando em PLN?

Há uma coisa realmente boa sobre trabalhar em Processamento de Linguagem Natural (PLN), e é o fato de que o campo é muito amplo. Eu diria que a IA toca em áreas "muito humanas" com as quais todos estamos familiarizados: linguagem, seu significado, tentando resolver suas ambiguidades e polissemias na tradução automática, nos ouvindo e nos ajudando por meio de assistentes pessoais... No entanto, muitos desafios permanecem.

Nossa missão é combinar inteligência humana e tecnologia para que as pessoas possam extrair informações de dados de uma maneira que de outra forma não poderiam. A tradução automática, em todas as suas formas, é um desafio que consideramos ter praticamente resolvido e onde os usuários podem treinar suas máquinas e criar suas próprias "fazendas" de tradução privadas.

Agora, a questão é: o que fazemos com toda essa informação? Temos que procurar e identificar atores, lugares, datas e talvez até ações (verbos) e combinações entre eles. Queremos que nossa IA seja capaz de ler o texto para descobrir informações que os humanos não têm tempo para ler ou processar, e isso inclui, por exemplo, descobrir links para grupos de policiais, advogados, detetives ou economistas.

Por que isso é importante e qual o impacto que tem na sociedade?

O PLN é, em sua essência, um conjunto de algoritmos de aprendizado de máquina que entendem e até mesmo escrevem texto.

Como eu disse antes, para mim, é uma das áreas mais emocionantes de pesquisa dentro da IA. É onde tudo está acontecendo, e estamos caminhando para um futuro onde a inteligência artificial para texto (e voz) estará disponível como um serviço que acelerará a adoção da tecnologia.

Todos os dias, sem exceção, somos confrontados com centenas de informações que não podemos mais processar. Quando essas informações têm de ser meticulosamente revisadas, os recursos humanos e as competências são limitados, e uma das nossas principais restrições é o tempo.

Estamos trabalhando para resolver esse desafio:

Motores de PLN com modelos que podem ler e resumir longos corpos de texto, extrair conceitos-chave, reconhecer e identificar pessoas que podem ser mencionadas e identificar padrões e estruturas que os leitores humanos podem perder.

Tudo isso tem, o que eu chamo, implicações de 2º, 3º e 4º grau.

Implicações imprevistas: seremos capazes de saber sobre o que é um texto, documento, relatório, etc., em uma língua estrangeira sem a necessidade de traduzi-lo (a máquina fará isso como um processo interno). Além disso, será possível extrair links entre pessoas e fatos de maneira mais rápida.

Isso pode ter repercussões rápidas em ambientes legais, como uma melhor compreensão das evidências forenses, mas também na inteligência policial, por exemplo.

Também pode nos permitir "entender" grandes quantidades de informações do nosso passado. A Europa é muito rica em repositórios históricos, arquivos e bibliotecas, e levaria 100 vidas para ler e entender todo o seu conteúdo. Tomemos como exemplo o Arquivo das Índias em Sevilha, toda a documentação de três séculos de presença espanhola no continente americano. Há muita informação de referência cruzada a ser explorada.

Em alguns projetos europeus, estamos trabalhando para recuperar a memória histórica do povo judeu, por exemplo.

Falando da terceira e quarta implicações, vamos imaginar processos judiciais, onde a evidência está disponível para promotores e partes muito mais rápido e com, digamos, métricas "industriais". Esses processos judiciais mais lentos podem se tornar processos mais ágeis, o que tem impacto na qualidade de vida dos cidadãos. IA, e dentro dela PLN, estão aqui para tornar nossas vidas mais fáceis e melhores.

Pode nos dar outros exemplos mais concretos?

Claro que sim. Além do campo de inteligência ou jurídico, uma empresa de recursos humanos pode pré-processar currículos em outros idiomas, até mesmo extrair informações-chave, seja com palavras ou resumos curtos. Uma empresa financeira também poderia usar o ECO para entender enormes quantidades de arquivos regulatórios em chinês ou japonês, com seus respectivos resumos.

O objetivo seria identificar riscos potenciais para aquelas empresas que têm exposição ao mercado chinês, e eu posso pensar em muitos...

Não posso revelar mais sobre nosso trabalho, mas não é surpresa que teremos modelos pré-treinados e também trabalharemos com clientes para personalizar modelos para tarefas específicas ou conjuntos de dados específicos.

Estamos no meio de uma revolução com o processamento de linguagem natural no momento, e isso significa que um grande número das tarefas de leitura e escrita que ainda nos ocupam como seres humanos serão capazes de ser executadas por máquinas para nosso benefício.

Quais outras áreas são importantes em seu desenvolvimento?

Análise de sentimentos.

Se acoplarmos todos os itens acima a uma classificação positiva ou negativa, a informação resumida se torna muito poderosa. Vamos cruzar dados de declarações, por exemplo, com os investimentos em ações de uma determinada pessoa e encontrar o sentimento positivo ou negativo e a tendência de uma ação listada. As palavras ou atos de certas pessoas podem ter uma relevância muito alta nos mercados de ações.

Você tem alguma palavra final, Manuel?

Vamos testemunhar uma nova forma de inteligência, relacionamentos e comportamento, novas inteligências e insights, a uma velocidade e escala que até agora não era nem possível nem acessível a nós, simplesmente porque não podíamos ler o suficiente nem encontrar as relações profundas.