As traduções do Google Tradutor estão quase chegando a um nível humano

Paulo Higa
Por
• Atualizado há 1 semana
google-tradutor-foto

O Google Tradutor completou dez anos de operação em abril e muita coisa mudou nos bastidores. No início, o serviço dependia apenas de tradução de máquina baseada em frases, o que já era mais eficiente que traduzir palavra por palavra, como faziam outros tradutores mais simples. Agora, o Google está colocando para funcionar sua tecnologia de tradução por redes neurais — e a qualidade é bem próxima das traduções feitas por humanos.

Simplificando, a tradução de máquina baseada em frases (PBMT, na sigla em inglês) divide o texto que você digita no Google Tradutor em várias palavras e frases, que por sua vez são traduzidas de forma independente entre si. Já a tradução de máquinas neurais (NMT) considera a sentença inteira como uma única unidade de tradução.

Se você é atento, já percebeu qual é o grande problema do NMT: caso eu escolha penejar uma sentença com vocábulos demasiados insólitos, meramente sendo pernóstico*, a rede neural do Google Tradutor teria dificuldade em interpretá-la. Os pesquisadores tentaram algumas soluções que até funcionavam, mas não eram rápidas o suficiente para funcionar num serviço do tamanho do Google Tradutor, que lida com inúmeras solicitações por segundo.

Então eles decidiram quebrar sentenças com palavras raras em unidades menores, gerando um bom equilíbrio entre flexibilidade e rapidez de tradução, e evitando tratamentos específicos para palavras desconhecidas. Você pode conferir as fórmulas, os gráficos e outros detalhes neste PDF, mas a representação gráfica disso do chinês para o inglês é assim (ele lê a sentença inteira e depois calcula a relevância de cada parte, representada pelo “Attention”, para retornar o resultado em inglês):

chines-traducao-neural

O resultado está mais próximo dos humanos, principalmente em espanhol e francês. Humanos deram uma nota de 0 (uma coisa sem sentido) a 6 (tradução perfeita) para traduções feitas por humanos, pelo método antigo (PBMT) e pela rede neural do Google. Do francês para o inglês e do inglês para o espanhol, as notas dadas são extremamente parecidas — e bem maiores que as avaliações para a PBMT.

traducao-eficiencia-neural-pbmt

O chinês é uma das línguas mais complexas para o Google Tradutor (e a que foi pior avaliada nas traduções), mas também uma das que mais se beneficia do novo método. Por isso, o Google anunciou nesta terça-feira (27) que 100% das 18 milhões de traduções diárias (!) do chinês para inglês já estão sendo feitas com a NMT. Nos próximos meses, o Google espera levar a tecnologia para mais pares de idiomas (são mais de 10.000 combinações de idiomas suportadas).

Ainda há vários problemas: o Google diz que o tradutor “pode cometer erros significativos que um tradutor humano nunca cometeria, como perder palavras e traduzir incorretamente nomes próprios ou termos raros, e traduzir frases isoladas em vez de considerar o contexto do parágrafo ou da frase”. Mas, pelo visto, os avanços que estão por vir são bem animadores.

* Se não entendeu, traduz para o inglês que fica bem mais fácil.

Tecnocast 049 – O Futuro do Trabalho

Com a chegada das máquinas super inteligentes, a mão de obra humana será cada vez mais desnecessária. E isso vale para trabalhos criativos e intelectuais, também! Não pense que estamos imunes à mudança. Os algoritmos são desenvolvidos para aprender de forma similar ao cérebro humano. Então se a gente consegue, “eles” também vão conseguir — só que farão melhor e mais rápido. Como será esse futuro? Batemos um papo no Tecnocast!

049-tecnocast

Receba mais notícias do Tecnoblog na sua caixa de entrada

* ao se inscrever você aceita a nossa política de privacidade
Newsletter
Paulo Higa

Paulo Higa

Ex-editor executivo

Paulo Higa é jornalista com MBA em Gestão pela FGV e uma década de experiência na cobertura de tecnologia. No Tecnoblog, atuou como editor-executivo e head de operações entre 2012 e 2023. Viajou para mais de 10 países para acompanhar eventos da indústria e já publicou 400 reviews de celulares, TVs e computadores. Foi coapresentador do Tecnocast e usa a desculpa de ser maratonista para testar wearables que ainda nem chegaram ao Brasil.

Canal Exclusivo

Relacionados