PangeaMT Masker
Featured Image

3 min read

18/05/2023

Relatório ALPAC

O evento mais conhecido na história da tradução automática é, sem dúvida, a publicação do relatório ALPAC (Automatic Language Processing Advisory Committee, 1966) em novembro de 1966. Seu efeito foi pôr fim ao substancial financiamento da pesquisa em MT nos Estados Unidos por cerca de vinte anos. Mais significativo, talvez, foi a clara mensagem ao público em geral e ao resto da comunidade científica de que a MT era sem esperança. Até hoje, o "fracasso" da MT ainda é repetido por muitos como um fato indiscutível. O impacto da ALPAC tem sido inegável.  

John Robinson Pierce, director de pesquisa da AT&T, e chefe  da ALPAC.

A primeira metade do relatório investigou as necessidades de tradução de cientistas e funcionários do governo dos EUA e a demanda e oferta gerais de traduções do russo para o inglês. O ALPAC começou por perguntar se, com a esmagadora predominância do inglês como língua da literatura científica, poderia ser mais simples e mais econômico para usuários frequentes de traduções do russo para o inglês aprenderem a ler os documentos no idioma original; isso poderia ser alcançado em 200 horas ou menos, e uma quantidade crescente de cientistas e engenheiros americanos possuíam a habilidade. Em seguida, estabeleceu que apenas cerca de 20 a 30% dos artigos russos em alguns campos teriam sido aceitos para publicação em revistas americanas. Assim, não havia necessidade urgente de tradução.

 

John_Robinson_Pierce-ALPAC-Report

Havia, porém, vários problemas cruciais com a tradução. Trata-se da qualidade, da rapidez e do custo. A qualidade tinha de ser adequada às necessidades dos solicitantes, uma vez que uma tradução perfeita e polida para um leitor limitado era uma perda de tempo e dinheiro. No que se refere à velocidade, o ALPAC viu muito espaço para melhorias: o serviço mais rápido (do JPRS) era de 15 dias para 50 páginas; os documentos enviados a contratantes externos pela Divisão de Tecnologia Estrangeira dos EUA levavam um mínimo de 65 dias; e quando processados pelo sistema de tradução automática do FTD, levavam 109 dias (devido a longos processos de pós-edição e produção).  

No que diz respeito ao custo, o ALPAC considerou o que as agências governamentais estavam pagando a tradutores humanos, que variava de US $ 9 a US $ 66 por 1000 palavras. Foram efectuados cálculos do custo por leitor das diferentes formas de tradução, incluindo o resultado não editado do sistema FTD. Estes custos incluíam o tempo investido pelos leitores. Assumindo que o leitor médio leva o dobro de tempo para ler documentos de tradução automática não editados, em oposição à tradução humana de boa qualidade, concluiu que, se os documentos fossem lidos por mais de 20 pessoas, a tradução humana tradicional era mais barata do que MT.

Em seguida, o relatório abordou o estado actual da tradução automática. Começou com uma definição: A tradução automática "presumivelmente significa passar por algoritmo do texto-fonte legível por máquina para o texto-alvo útil, sem recorrer à tradução ou edição humana e, neste contexto, não houve tradução automática de texto científico geral, e nenhuma está em perspectiva imediata". A alternativa que viu foi tradução automática pós-editada. No entanto, admitiu que não podia "avaliar a dificuldade e o custo da pós-edição".

Em alguns aspectos, o impacto do relatório da ALPAC é exagerado. A pesquisa em TA nos EUA não parou completa e repentinamente em 1966. Alguns projetos continuaram, nomeadamente na Wayne State University, sob Harry Josselson até 1972, e na Universidade do Texas, sob Winfred Lehmann e Rolf Stachowitz até 1975. Além disso, em retrospecto, pode-se, naturalmente, concordar que o relatório da ALPAC tinha toda a razão em ser cético em relação à tradução automática, porque a qualidade era, sem dúvida, pobre e não parecia justificar o nível de apoio financeiro que recebia. Foi também correto identificar a necessidade de desenvolver a assistência de máquinas para os tradutores e sublinhar a necessidade de uma investigação mais básica em linguística computacional.

No entanto, pode ser criticado por se concentrar exclusivamente nas necessidades de tradução de cientistas e agências dos EUA e não reconhecer as necessidades comerciais e industriais mais amplas em uma economia global já em expansão. Além disso, o relatório concentrou-se exclusivamente nas necessidades do governo e do exército dos EUA ao analisar e digitalizar documentos em língua russa. Não se preocupava de forma alguma com outras utilizações potenciais ou utilizadores de sistemas de tradução automática, nem com quaisquer outras línguas.

No capítulo sobre "Processamento automático de linguagem e linguística computacional" há uma consideração da contribuição da pesquisa de TA para os avanços da NLP em geral. Seu efeito no hardware de computadores foi insignificante; ele contribuiu para os avanços no software de computadores, mas que, de longe, o resultado mais importante foi o seu efeito na linguística. Aqui eles destacaram insights sobre sintaxe e gramática formal, trazendo teorias mais sutis em confronto com corpos de dados mais ricos, e concluindo que, embora "a revolução na linguística não tenha sido apenas o resultado de tentativas de tradução e análise automática, é improvável que a revolução teria sido extensa ou significativa sem essas tentativas".

No entanto, apesar desta influência favorável, o relatório da ALPAC sublinhou mais uma vez que "não temos uma tradução automática útil e não há perspectiva imediata ou previsível de uma tradução automática útil". Reiterou as potenciais possibilidades de melhorar a qualidade da tradução, nomeadamente no domínio da assistência automática: "A tradução assistida por máquinas pode ser uma importante via para uma tradução melhor, mais rápida e mais barata". Mas o ALPAC não recomendou a pesquisa básica: "O que a tradução assistida por máquina mais precisa é de boa engenharia". O ALPAC recomendou apoiar a investigação como meio de acelerar o processo de tradução humana, a avaliação da velocidade e dos custos de vários tipos de tradução assistida por máquina, a adaptação dos processos de edição e de produção mecanizados existentes na tradução. Para mais informações sobre o relatório da ALPAC,  clique aqui.