ancienne version de Portalingua

Actualités

Informatique et Internet

O Google quer um mundo em que todos se entendam

29/4/2011

Um executivo português pega num telemóvel topo de gama para falar com um parceiro de negócios em França. Ambos carregam num botão no ecrã do aparelho para activar a funcionalidade de tradução automática. Cada um pode agora falar no conforto da sua língua mãe: o aparelho faz o reconhecimento de voz de cada um dos lados e uma voz computorizada traduz o discurso, em tempo real.

A tecnologia ainda é ficção científica. Mas faz parte da visão de futuro do Google, uma das empresas que tem estado a investir muitos recursos em várias ferramentas de tradução automática.

A empresa já desenvolveu para o sistema Android (um sistema operativo que qualquer fabricante pode usar em smartphones) uma aplicação, gratuita, para fazer traduções de vários tipos. Uma das funcionalidades permite a tradução de SMS.

A tradução é eficaz, desde que a escrita seja ortograficamente correcta. Abreviações e trocas de letra (tão comuns na linguagem das mensagens de texto) dão maus resultados.

A aplicação – chamada Google Translate – contempla várias dezenas de línguas, para a tradução de SMS. Mas também tenta fazer reconhecimento de voz – uma funcionalidade que ainda está em fase alfa (o que significa que é muito experimental) e que só suporta inglês e espanhol. O utilizador fala numa destas línguas e a aplicação sugere, em texto escrito, a tradução na outra.

“O nosso reconhecimento de voz recolhe muitos exemplos de sons falados e das palavras que representam”, explica ao PÚBLICO o director da investigação científica do Google, Peter Norvig, um ex-cientista da NASA e uma das grandes autoridades mundiais no campo da inteligência artificial.

Norvig parece reconhecer que ainda há muito caminho a percorrer na afinação da tecnologia, ao qualificar o tradutor de voz “como aquilo que está, por agora, mais perto de um tradutor universal de ficção científica”.

Traduções mais eficazes

O Google, porém, já é muito mais eficaz a traduzir texto. Em translate.google.com é possível encontrar um tradutor de blocos de texto ou de páginas Web que faz traduções entre dezenas de línguas (embora ão tão bem como um tradutor humano).

Há ainda uma ferramenta experimental (que tem de ser activada pelo utilizador), que permite configurar o Gmail para que e-mails que não estejam em determinadas línguas sejam automaticamente traduzidos (já pode perceber todo o spam asiático que recebe na sua caixa).

Por fim, o browser do Google (o Chrome), tem uma ferramenta que traduz automaticamente sites em línguas estrangeiras – quase perfeito para ler o que os jornais dos países europeus estão a escrever sobre a crise portuguesa.

“Estamos a investir imensa energia no que chamamos ‘tradução por máquinas’, já que vemos um enorme potencial em derrubar as barreiras de linguagem de quem usa a Web”, diz Norvig. O raciocínio faz sentido: quanto mais páginas os utilizadores conseguirem consumir, mais olhos o Google tem para mostrar os anúncios publicitários de onde provém a esmagadora maioria das receitas da empresa.

Quando o Google cria uma tradução, procura padrões em milhões de documentos que já tenham sido traduzidos por humanos. Esses padrões são usados para decidir qual a melhor tradução para uma palavra ou frase.

O serviço de tradução “cobre 50 línguas, traduzindo entre qualquer par delas”, frisa o responsável. “O sistema que construímos dá-nos a possibilidade de adicionar novas línguas rapidamente. Fomos capazes de adicionar o Farsi [falado no Irão e no Afeganistão, por exemplo] e o crioulo haitiano em apenas uma semana, quando se tornaram importantes por causa dos acontecimentos mundiais”.

O gigante da Internet, contudo, não é o único a desenvolver sistemas de tradução. O motor de busca Bing (o rival da Microsoft que tem vindo a crescer em quota de mercado) também oferece um tradutor automático de textos e sites.

Também o Windows Live Messenger, uma ferramenta de chat muito popular em Portugal, tem um tradutor. É preciso adicionar como contacto o Microsoft Translation Bot (o endereço é mtbot@hotmail.com). Depois, basta iniciar uma conversa a três (ou mais) em que o Bot esteja presente. Sempre que um dos intervenientes escreve algo numa língua, o Messenger apresenta a frase original e o Bot escreve uma tradução.

E língua franca?

Há no tecno-entusiasmo da tradução automática uma questão incontornável: não serve o inglês de língua franca? Para quê o trabalho de desenvolver ferramentas de tradução, se o executivo lisboeta poderia perfeitamente falar em inglês com o seu congénere de França?

Nas comunicações do mundo empresarial, o inglês é usado com frequência e, em Portugal, as expressões anglófonas até entram no discurso corrente. No “ambiente corporate” fala-se em performance (em vez de desempenho) ou em devices (em vez de dispositivos).

“Somos bastante contagiados pela informação a que constantemente temos acesso e que somos forçados a ler, nomeadamente a informação interna, que é em inglês”, admite o director técnico da Symantec em Portugal, Timóteo Menezes. A Symantec é uma multinacional americana e o inglês é, naturalmente, a língua de serviço – mas há excepções.

Menezes nota que a facilidade em comunicar em inglês não se nota em todos os países. “Tipicamente, [em Portugal] não traduzimos as apresentações e outras informações, pois temos a sorte de os portugueses, em regra, e a nível profissional, entenderem bem o inglês, o que já não acontece em países como a Espanha, França e Itália”.

O responsável vê mesmo vantagens em fazer-se entender na língua dos colegas: “Sempre que possível tento fazer um esforço para tentar falar a língua nativa dos colegas, como o francês e italiano, pois é uma maneira de estreitar as relações profissionais e pessoais”. Mas, claro, o estreitamento das relações pessoais é exactamente o tipo de efeito que a voz computorizada de um tradutor automático dificilmente conseguirá oferecer.

A Web não está em inglês

Mesmo que o inglês pudesse servir de língua comum, boa parte da Web não está em inglês, contrariamente ao que frequentemente se pensa, nota um relatório da UNESCO, publicado em 2009 (a organização tem-se mostrado preocupada com a diversidade linguística no mundo digital – diferentes línguas significam diferentes culturas e diferentes formas de ver o mundo).

“Numa área em que as demografias têm mudado a um ritmo sem precedentes na história humana, deu-se lugar à criação de mitos, como o grande domínio e a presença estável do inglês na Web”, lê-se no documento. “Em geral, este mito não tem tido uma resposta por parte do mundo académico”.

Daniel Pimienta, um dos autores do estudo, trocou com o PÚBLICO e-mails em que alternou nas respostas o espanhol, o português e o inglês. “Não acredito que o inglês seja a língua franca”, sublinha Pimienta, que é doutorado em informática e preside a uma organização não-governamental com sede na Republica Dominicana que promove o desenvolvimento através das tecnologias de informação.

Pimienta nota que o inglês é percebido “por menos de 15 por cento da população mundial” e que “quanto mais pessoas entram na Internet, mais relevante se vai tornar este limiar” na questão da distribuição linguística online.

Segundo o estudo feito para a UNESCO, o número de páginas em inglês e o número de cibernautas falantes de inglês está a cair desde meados da década de 1990, altura em que foram recolhidos os primeiros dados.

Números listados no relatório indicam que a Web em inglês era, em 2007, 45 por cento do total – mas os investigadores afirmam que o valor é uma estimativa demasiado alta, que decorre do facto de terem sido usadas as páginas indexadas por motores de busca, os quais têm em consideração “critérios comerciais”. Com base na divisão linguística dos cibernautas, os investigadores argumentam que a percentagem do inglês deveria estar abaixo dos 40 por cento – e com tendência para descer.

Várias línguas francas

Ainda segundo o estudo, em 2007, para cada 100 páginas em inglês, encontravam-se três escritas em português (oriundas sobretudo do Brasil), um pouco mais de oito escritas em espanhol, quase dez em francês e 13 páginas escritas em alemão. E a entrada no mundo digital dos países asiáticos em desenvolvimento também tem mudado o cenário, que pende para uma menor ocidentalização.

“As línguas muito utilizadas na Internet nos anos 1990 eram principalmente ocidentais (inglês, alemão, francês, italiano, espanhol, português, sueco, neerlandês, etc), juntamente com o japonês, o árabe e o russo”, nota ao PÚBLICO Daniel Prado, outro dos co-autores do estudo e membro da direcção da União Latina, uma organização de que Portugal faz parte e que visa promover a cultura dos países latinos. “Foi apenas em 2000 que as outras línguas asiáticas (manifestamente o chinês, o coreano, o malaio, o tailandês, etc.) tomaram um lugar mais importante”.

"Existem várias línguas francas no mundo", explica Prado, e estas são usadas consoante as comunidades e regiões do mundo. "A população mundial tende para ser bilingue, dominando em primeiro lugar a língua falada em casa e uma segunda que seria língua franca na sua esfera de relações superior". Assim, "um peruano hispanófono vai tender para falar o inglês como segunda língua", mas "um quíchua [indígena da América do Sul] vai falar espanhol como segunda língua".

Nesta hierarquia, o inglês é uma língua "hipercentral", mas as "línguas supercentrais" – o francês, espanhol, português, árabe, russo, chinês, alemão – ocupam o lugar de línguas francas em alguns contextos. "Este fenómeno tende a acelerar-se, embora o inglês fique a principal língua usada nas negociações internacionais, na ciência, nos protocolos e normativas, no comércio."

Mais inteligentes

As ferramentas de tradução automática, como aquelas que o Google e Microsoft oferecem, podem ser úteis, mas ainda precisam de ser muito aperfeiçoadas, argumenta Daniel Pimienta.

“Ainda não estão suficientemente maduras para serem usadas de forma fiável em conteúdos Web. Suspeito que mais e mais pessoas vão usar estas fantásticas ferramentas para ter uma ideia do significado de conteúdos e para decifrar comunicações em línguas que não entendem. Mas o futuro dos intérpretes humanos ainda é risonho e eles são provavelmente os melhores utilizadores destas ferramentas”.

A opinião é partilhada por Daniel Prado. “A qualidade é fraca (apesar de ter vindo a melhorar cada vez mais), de modo que a tradução automática é reservada à simples compreensão de um texto estrangeiro. Não podem em caso algum ser consideradas verdadeiras traduções e ainda menos textos com valor jurídico. A margem de erro muitas vezes é grande.”

Já para Peter Norvig, o perito em inteligência artificial que trabalha para o Google, a tradução automática fará parte de um melhoramento humano por via da tecnologia – uma tendência para criar inteligência artificial que torne a Humanidade (e não os computadores) mais inteligente.

“O que percebemos é que não queremos inteligência artificial algures dentro de uma máquina. Em vez disso, preferimos ter toda esta ciência avançada – identificação de voz, visualização de dados, tradução de línguas - a tornar-nos melhores. Queremos ser mais espertos. Queremos inteligência aumentada”.

Source : PÚBLICO

Mots-clés : google portugais traduction

Aucun commentaire • commenter cet article

Après une longue période d’hégémonie linguistique, on voit peu à peu apparaître une prise de conscience de la menace pesant sur les langues du monde et une ouverture vers une reconnaissance de la diversité linguistique comme facteur de développement durable.

Créé par l’Union latine, et au début tourné vers la description des langues des pays latins, Portalingua se veut aujourd’hui un espace transparent d’information, de réflexion et de discussion sur le comportement des langues du monde dans la société de la connaissance (cyberespace, sciences, techniques, organisations internationales, traduction, etc.). Il prétend susciter un frein au quasi-monolinguisme régnant dans de nombreux secteurs

Union latine

Fondée en 1954, l’Union latine est une organisation internationale regroupant 37 États membres qui œuvre pour la diversité culturelle et le multilinguisme.

DTIL

Direction terminologie et industries de la langue

Tél. (33 1) 45 49 60 62

portalingua@unilat.org

Mentions légales

Lettre d'information

Inscrivez-vous pour être tenu informé de nos activités :

avec le soutien du ministère de la Culture et de la Communication (Délégation générale à la langue française et aux langues de France - DGLFLF).