Por Thelma L. Sabim
O que fazer com aqueles arquivos preciosos traduzidos há anos, quando a única ferramenta era “apenas” o processador de texto? Vale a pena ressuscitar alguns para criar memória?
Claro que tempo x benefício é determinante. Se o arquivo recebido do cliente estiver em formato eletrônico, ficará mais fácil. Basta fazer o alinhamento com a tradução e nasce uma memória! E se o original veio em formato PDF? Daí é um pouco mais complicado, mas se realmente o material for importante para consulta em novos projetos, o jeito é passar o PDF pelo Nuance OmniPage ou ABBYY FineReader. Com alguns ajustes e consertos no que resultar do OCR, dá para criar um bom documento fonte para o alinhamento, sobretudo se gravado como texto simples.
Algumas CATs oferecem a função de alinhamento, mas geralmente é um processo demorado e desestimulador. Fiz um teste com o Stingray Document Aligner da MaxPrograms, uma empresa sediada no Uruguai. Gostei da simplicidade e por ser cross-platform. A licença custa 70 Euros, um preço bem acessível comparado ao de uma outra ferramenta, o Align Factory Light da Terminotix, que custa 420 dólares. No site, há outras opções apenas para fazer alinhamento, mas nunca experimentei, inclusive um alinhador grátis on-line, o YouAlign.
Para quem não quer investir muito e não está contente com a função de alinhamento da sua CAT, há outras opções gratuitas para criar TMX, o padrão utilizado pelas diversas CATs para tornar os arquivos de memórias compatíveis.
Uma delas é o Rainbow, um dos aplicativos do Okapi FrameWork criado originalmente pela Enlaso. Embora a função de alinhar frases do Rainbow não seja fácil de usar, gostaria de destacar outros recursos muito úteis que já usei como extrair texto para tradução de arquivos de diversos formatos, como rtf, html, xml, php, properties do Java. Ainda há outros recursos que quero aprender como pseudo-tradução e comparação de tradução.
Para a função de alinhamento do Rainbow, chamada Sentence Alignment, os documentos devem ser primeiro convertidos para o formato do OpenOffice, ou seja .odt, senão o Rainbow não gerará a memória. É preciso dedicar tempo para aprender todos os passos deste procedimento.
Outra opção de alinhamento se chama Bitext2tmx. Ela pode ser baixada do Sourceforge.
Porém, o texto original e a tradução devem ser convertidos em formato txt primeiro. Esta ferramenta é bem básica.
Outras ferramentas importantes que agilizam o uso das TMs são os editores de memória. Uma delas, que está em processo de atualização, é o Olifant. O site oferece a versão de 2009. A nova versão revisada deverá ser liberada até o final do ano. O recurso que mais utilizo do Olifant é o de remover códigos de formatação das TMs para aumentar os “matches”. Pelo que li no site dos usuários do Okapi, o Olifant vai funcionar também em outras plataformas – no momento é só no Windows.
Outra ferramenta que é indispensável quando lidamos com memória é o ApSic Xbench, que funciona no Windows e é gratuita. Usei algumas vezes o recurso de converter TMs e sugiro aos colegas uma visita ao site.
Leave a Reply