4 lecture des minutes
24/05/2021
Traduction automatique : le rapport ALPAC
Qu'est-ce que le rapport ALPAC ? L'événement le plus connu de l'histoire de la traduction automatique est sans aucun doute la publication, en novembre 1966, du rapport du Comité consultatif pour le traitement automatique des langues (ALPAC).
Le rapport ALPAC a eu pour conséquence de mettre un terme au financement substantiel dont la recherche sur la traduction automatique (TA) avait bénéficié aux États-Unis pendant une vingtaine d'années. Bien que cela réponde à la question initiale, le message sans ambiguïté qui a été transmis au public et au reste de la communauté scientifique est peut-être plus important encore : la TA ne sert à rien. Aujourd'hui encore, nombreux sont ceux qui parlent de "l'échec" de la TA comme d'un fait irréfutable. L'impact d'ALPAC a été indéniable. La première moitié du rapport traite des besoins en traduction des scientifiques et des fonctionnaires américains, ainsi que de l'offre et de la demande globales de traductions russe-anglais.
Le rapport ALPAC commence par se demander si, compte tenu de la domination incontestée de l'anglais comme langue de la littérature scientifique, il ne serait pas plus simple et moins coûteux pour les utilisateurs réguliers des traductions russes d'apprendre à lire les documents dans leur langue d'origine. Il a constaté que cela pouvait se faire en 200 heures environ et que de plus en plus de scientifiques et d'ingénieurs américains étaient capables de le faire. Il a ensuite constaté que seuls 20 à 30 % des articles russes dans certains domaines étaient publiés dans des revues américaines. Il n'y avait donc pas d'urgence dans le domaine de la traduction. En revanche, plusieurs questions cruciales se posent en matière de traduction : principalement la qualité, la rapidité et le coût. La qualité doit être adaptée aux besoins des candidats, car une traduction raffinée et parfaite est une perte de temps et d'argent si le public cible a une capacité de lecture limitée.
En termes de rapidité, l'ALPAC a constaté qu'il y avait une grande marge d'amélioration : le service le plus rapide, celui du Joint Publications Research Service (JPRS), prenait 15 jours pour 50 pages ; les documents envoyés par la US Foreign Technology Division (FTD) à des contractants externes prenaient un minimum de 65 jours et, lorsqu'ils étaient traités par le système de traduction automatique de la FTD, prenaient 109 jours (en raison des processus de post-édition et de production). En termes de coûts, l'ALPAC a calculé le montant de la rémunération des traducteurs humains par les agences gouvernementales, allant de 9 à 66 dollars pour 1 000 mots. Les coûts ont été calculés sur la base du coût par lecteur des différentes formes de traduction, y compris le résultat non édité du système FTD. Ces coûts comprennent le temps passé par les lecteurs. Compte tenu du fait que le lecteur moyen met deux fois plus de temps à lire des documents MT non édités que des traductions humaines de qualité, le rapport ALPAC a conclu que, si plus de 20 personnes devaient lire les documents, la traduction humaine traditionnelle était moins onéreuse que la MT.
Le rapport décrit ensuite l'état de la traduction automatique. Il commence par une définition : la traduction automatique "signifie vraisemblablement le passage, à l'aide d'un algorithme, d'un texte source en langage informatique à un texte cible utile, sans recours à la traduction ou à l'édition humaine, et dans ce contexte, il n'y a pas eu de traduction automatique d'un texte scientifique général et il n'y en aura pas dans l'avenir immédiat". L'alternative envisagée était la traduction automatique avec post-édition. Toutefois, le rapport admet qu'il n'est pas "en mesure d'évaluer la difficulté et le coût de la post-édition".
Quel a été l'impact du rapport ALPAC ?
À certains égards, l'impact de l'ALPAC peut être surestimé : la recherche sur l'AT aux États-Unis ne s'est pas arrêtée brusquement en 1966. Certains projets se sont poursuivis, notamment à l'université d'État de Wayne sous la direction de Harry Josselson jusqu'en 1972, et à l'université du Texas sous la direction de Winfred Lehmann et Rold Stachowitz jusqu'en 1975. En outre, avec le recul, nous pouvons convenir que l'ALPAC avait de bonnes raisons d'être sceptique à l'égard d'AT, car la qualité était indubitablement médiocre et ne semblait pas justifier le niveau de soutien financier qu'elle recevait. L'ALPAC avait également raison de détecter la nécessité de développer des machines pouvant aider les traducteurs et de souligner le besoin d'une recherche plus fondamentale dans le domaine de la linguistique computationnelle.
Toutefois, on peut lui reprocher de trop se concentrer sur les besoins de traduction des scientifiques et des agences américaines et de ne pas reconnaître la portée plus large des besoins du commerce et de l'industrie dans une économie mondiale déjà en expansion. Deuxièmement, le rapport se concentre exclusivement sur les besoins du gouvernement et de l'armée américains en matière d'analyse et de numérisation de documents en langue russe. Il ne s'est à aucun moment penché sur d'autres utilisations potentielles ou utilisateurs de systèmes de TA ou d'autres langues.
Le chapitre sur le "Traitement automatique des langues et la linguistique informatique" réfléchit à la contribution de la recherche sur le traitement automatique des langues à l'évolution des RLP en général. Son influence sur le matériel informatique a été négligeable ; elle a permis des avancées dans le domaine des logiciels, mais le résultat le plus important est sans aucun doute son effet sur la linguistique.
Il a mis en évidence les connaissances en matière de syntaxe et de grammaire formelle, l'émergence de nouvelles théories à partir de corpus plus riches, et a conclu que si "la révolution en linguistique n'est pas exclusivement due aux tentatives de traduction automatique et d'analyse syntaxique, il est peu probable que la révolution aurait été grande ou significative sans de telles tentatives". Cependant, l'ALPAC a rappelé que, malgré cette influence positive, "nous n'avons pas de traduction automatique utile et il n'y a pas de perspective immédiate ou proche d'une telle traduction". Il a souligné les possibilités d'amélioration de la qualité de la traduction, notamment grâce à différents outils d'assistance : "La traduction assistée par ordinateur peut être une voie importante vers des traductions de meilleure qualité, plus rapides et moins chères". Mais l'ALPAC ne recommande pas la recherche fondamentale : "Ce dont la traduction assistée par ordinateur a le plus besoin, c'est d'une bonne ingénierie".
L'ALPAC a recommandé de soutenir la recherche visant à accroître la rapidité du processus de traduction humaine, l'évaluation de la rapidité et des coûts des différents types de traduction assistée par ordinateur et, enfin, l'adaptation des processus existants d'édition et de production automatiques en traduction. Pour plus d'informations sur le rapport ALPAC.