7 min read
06/09/2023
Em que ponto estamos com a tradução automática neural?
O que é a Transição de Máquina Neural?
A tradução automática neural (NMT) é a nova abordagem para a tradução automática. A NMT trabalha com uma arquitetura de ponta a ponta que visa treinar todos os componentes simultaneamente para maximizar seu desempenho. A arquitetura leva em conta a frase completa como um contexto, o que permite obter uma tradução fluente.
Conteúdo |
6. A tradução automática neural é útil para traduzir textos literários? |
O que é a tradução automática neural?
A tradução automática neural (NMT) é a nova abordagem para a tradução automática. A NMT trabalha com uma arquitetura de ponta a ponta que visa treinar todos os componentes simultaneamente para maximizar seu desempenho. A arquitetura leva em conta a frase completa como um contexto, o que permite obter uma tradução fluente.
O surgimento da tradução automática neural
A evolução da tradução automática neural (NMT) desde suas origens até os dias de hoje: Como a NMT se tornou um divisor de águas para fazer negócios globalmente?
Mal sabia ele que 120 anos depois, durante o experimento Georgetown-IBM de 1954, Nova York testemunharia a primeira demonstração de uma máquina de tradução automática de idiomas que convertia breves declarações sobre áreas como política, direito, química e assuntos militares do russo para o inglês.
A tradução automática (MT), ao longo de seu desenvolvimento, mudou muito - desde sistemas que exigiam horas e dias de tempo de computação para produzir uma tradução de qualidade duvidosa, até os atuais sistemas de tradução automática neural (NMT) que podem processar o mesmo conteúdo em meros segundos e com muito mais precisão.
Como funciona a tradução automática neural?
A tradução automática neural usa redes neurais para traduzir um texto do idioma de origem para o idioma de destino. Essas redes podem lidar com conjuntos de dados muito grandes e exigem pouca supervisão. Há dois tipos de redes neurais em sistemas de tradução: uma rede codificadora e uma rede decodificadora.
O que queremos dizer com rede neural?
Quando há uma série interconectada de nós modelada no cérebro humano, nós a chamamos de rede neural. Com esse sistema, as informações que chegam passam pelos nós e depois saem novamente. Essa estrutura é chamada de "rede neural de sequência para sequência" (Seq2Seq). Ela funciona observando uma frase no idioma de origem e produzindo uma frase no idioma de destino correspondente.
De que tipo de tradução automática neural eu preciso?
A qualidade da tradução automática neural pode ser aprimorada com a inclusão de revisão e edição por tradutores humanos após a primeira etapa do processamento por computador. Isso permite que sua tradução final seja 100% precisa e confiável, com um toque humano que uma máquina não pode oferecer.
Oferecemos dois tipos de serviços de edição para nossos projetos de tradução automática:
-
Tradução automática personalizada: Se você precisar traduzir uma grande quantidade de dados e for usar muita tradução automática, recomendamos treinar os mecanismos neurais do zero. Podemos extrair dados de sua área para criar um mecanismo especializado que abranja muitas áreas linguísticas.
-
Tradução automática adaptativa profunda: Parte de qualquer um de nossos mecanismos gerais que abrangem a maioria das áreas de especialização. Esse tipo de tradução é altamente recomendado para provedores de serviços linguísticos e clientes corporativos em horários de pico de produção ou em longo prazo.
A tradução automática neural alcançou a paridade humana?
Recentemente, o Google, a Microsoft e a SDL argumentaram que a tradução automática neural (NMT) alcançou a paridade da tradução humana com " Google's Neural Machine Translation System: Bridging the gap between human and machine translation", "Achieving human parity on automatic Chinese to English news translation" e "SDL cracks Russian-to-English translation", respectivamente.
Em um trabalho recente que acaba de ser aceito na conferência EMNLP 2018, estão sendo realizados experimentos que comparam traduções automáticas neurais com traduções humanas. A tarefa consiste em classificar 55 documentos e 120 frases do conjunto de testes chinês-inglês do WMT 2017. Os documentos e as frases são avaliados em condições monolíngues (somente texto no idioma de destino) e bilíngues (texto nos idiomas de origem e de destino). Os avaliadores são tradutores profissionais com pelo menos três anos de experiência e possuem avaliações positivas de clientes.
Para a condição monolíngue, foram recrutados 5 tradutores nativos do inglês, enquanto que para a condição bilíngue foram recrutados 2 tradutores nativos do chinês, 1 tradutor nativo do inglês e 1 tradutor nativo do inglês e do chinês. Na condição monolíngue, os tradutores preferiram o texto produzido por humanos ao texto produzido por máquina em termos de frases e documentos. Na condição bilíngue, as classificações dos tradutores demonstraram uma preferência significativa pela tradução humana em relação à tradução automática ao avaliar os documentos.
No entanto, ao avaliar frases isoladas, a tradução automática atinge a paridade com a humana, não demonstrando preferência. Essa é, sem dúvida, uma boa descoberta. A qualidade da NMT é impressionante, mas há dois aspectos importantes a serem considerados.
A primeira é que os autores são cautelosos ao concluir que os resultados poderiam nos fazer pensar que a MT tem um desempenho melhor em termos de adequação do que de fluência. No entanto, a avaliação da MT provavelmente pode ser mais favorável quando a maioria dos tradutores é nativa do idioma de origem.
A segunda é que a avaliação em nível de frase pode ser insuficiente, pois os contextos textuais, culturais e outros são desconhecidos, e esses elementos devem ser levados em consideração para realmente entender a tradução. Essas descobertas confirmam a necessidade de continuar pesquisando em nível de documento, como os trabalhos recentes.
Ao aumentar o contexto no nível do documento, a tradução automática poderá melhorar a coerência e a coesão do texto traduzido. A NMT no nível do documento pode evitar alguns erros que, no nível da frase, são impossíveis de reconhecer, como a concordância de gênero entre as frases.
Continue lendo: A linguagem, a base da tradução automática neural
A tradução automática neural é útil para traduzir textos literários?
O mercado de tradução de literatura está crescendo devido ao uso de livros eletrônicos. Nos últimos anos, as vendas de livros eletrônicos dobraram em todo o mundo. Hoje em dia, é mais fácil ler um livro em qualquer dispositivo ou até mesmo ouvir audiolivros.
Obviamente, a tradução também está crescendo nesse mercado. No entanto, a tradução de textos literários exige criatividade que as máquinas não podem permitir, por exemplo, enfrentar a intraduzibilidade, metáforas ou expressões idiomáticas. Esse é o cenário mais desafiador para a tradução automática. Apesar do aprimoramento do desempenho da tradução usando a tradução automática neural (NMT) por levar em conta a frase como um contexto, os textos literários ainda são difíceis de traduzir automaticamente.
Para saber até onde podemos progredir com a tradução automática no domínio da literatura, neste trabalho apresentado pelo Dr. Antonio Toral e pelo Prof. Andy Way, 12 romances são traduzidos do inglês para o catalão com sistemas NMT:
-
Sunset Park, de Auster (2010)
-
Jogos Vorazes de Collins #3 (2010)
-
O Senhor das Moscas, de Golding (1954)
-
O Velho e o Mar (1952), de Hemingway
-
Ripley Under Water (1991), de Highsmith
-
A Thousand Splendid Suns (2007), de Hosseini
-
Ulysses de Joyce (1922)
-
On the Road (1957), de Kerouac
-
1984 de Orwell (1949)
-
Harry Potter nº 7, de Rowling (2007)
-
O Apanhador no Campo de Centeio (1951), de Salinger
-
O Senhor dos Anéis, de Tolkien, nº 3 (1955)
O inglês e o catalão, que vêm de famílias diferentes, foram escolhidos para tornar a tarefa mais desafiadora. Além disso, o catalão é um idioma europeu de médio porte, o que significa que há recursos disponíveis para treinar um sistema, mas não tanto quanto outros idiomas europeus importantes, como espanhol, francês, alemão ou italiano.
O sistema NMT foi treinado com 133 romances traduzidos do inglês para o catalão e 1.000 livros escritos em catalão. As traduções de 3 livros foram classificadas manualmente por falantes nativos de catalão, comparando a tradução humana com a NMT. Para 2 livros, o sistema NMT obteve qualidade equivalente às traduções humanas em cerca de um terço dos casos.
A qualidade da tradução automática neural
A qualidade da tradução automática neural depende de um grande número de fatores, independentemente da ferramenta escolhida. O par de idiomas, a quantidade de dados de treinamento e até mesmo o volume e o tipo de textos a serem traduzidos também devem ser levados em consideração. Quanto mais traduções um modelo realizar para um domínio e idioma específicos, melhor será a qualidade das traduções finais.
Ao longo dos anos, a tradução automática ganhou popularidade e, como consequência, foi necessário pesquisar e aprimorar a tecnologia. Conhecer as ferramentas disponíveis e saber qual é a melhor para o tipo de tradução que você precisa é essencial para obter a qualidade ideal.
Na Pangeanic, temos traduções automáticas de qualidade quase humana para diferentes usos. Nossos anos de experiência no setor de tradução nos forneceram dados de treinamento suficientes para permitir que nossos mecanismos forneçam traduções de qualidade de grandes quantidades de documentos em tempo recorde.
As principais vantagens da tradução automática neural
A tradução automática neural oferece muitas vantagens para as empresas, pois permite que grandes quantidades de texto sejam traduzidas para diferentes idiomas em um período de tempo reduzido, o que é essencial na era digital do imediatismo.
As primeiras ferramentas de tradução automática revolucionaram o mercado, mas com a chegada da tradução automática neural baseada em modelos neurais, o campo da tradução assistida por computador foi completamente transformado, dando origem a uma ferramenta mais precisa e interessante para quem precisa dela.
Alguns dos benefícios dessa ferramenta incluem:
-
Traduções precisas: Baseia-se em conjuntos de dados cada vez maiores e, usando modelagem linguística, os mecanismos de tradução automática neural são capazes de contextualizar palavras e frases para um trabalho de tradução preciso e suave.
-
Aprendizado rápido: As redes neurais podem ser treinadas rapidamente por meio de processos automatizados.
-
Integração fácil e flexível: Uma vantagem de usar essa ferramenta é que ela pode ser integrada via API e SDK em qualquer software e pode ser aplicada a muitos formatos de arquivos de conteúdo.
-
Ele é personalizável: Dependendo do conteúdo a ser traduzido, o modelo pode ser atualizado para adaptá-lo à demanda do consumidor por meio de bancos de dados terminológicos, glossários específicos e outras fontes de dados para melhorar os resultados.
-
Custo-benefício: a tradução humana consome muito tempo e pode ser cara, especialmente em projetos que envolvem um grande número de palavras e idiomas. A tradução automática neural possibilita a produção de traduções por uma fração do custo, e você sempre pode contar com tradutores humanos para cuidar da pós-edição da tradução automática.
-
Ela é escalonável: Quando os processos de tradução precisam ser expandidos, a tradução automática neural permite atender ao aumento da demanda com facilidade e rapidez.
Avanços tecnológicos na tradução automática neural
A tecnologia melhorou o desempenho da tradução automática nesse domínio, mas ainda é uma taxa baixa, o que exige muitos esforços de revisão humana, conforme mencionado em uma postagem anterior. Os autores estão planejando investigar se a NMT pode ser útil para auxiliar tradutores humanos na tradução de textos literários, medindo o esforço e a qualidade.
Novas abordagens e coleta de dados melhorarão esses resultados. Há muitas pesquisas em andamento para alcançar uma taxa competitiva no domínio da literatura. Um dia, a tradução automática estará pronta para isso, mas levará algum tempo.