logo

terça-feira, 9 de março de 2010

Como funciona a caneta tradutora?

Parece coisa de Harry Potter ou James Bond: Você passa a canetinha sobre um texto em língua estrangeiras e ela vai traduzindo tudo instantaneamente. E, além da tradução em texto, ela lê em voz alta o que traduz. Parece mágica, mas é mais simples do que aparenta. A caneta tradutora nada mais é do que um minicomputador com um escâner na ponta. A "magia" ocorre graças ao software de OCR (sigla em inglês de reconhecimento óptico de caracteres), que identifica as letras e joga o texto em um software de tradução instantânea instalado na caneta. Como há fontes diferentes umas das outras, nem sempre o OCR consegue reconhecer certas letras e nesse caso entra em ação o ICR (reconhecimento inteligente de caracteres) um programa mais "espertinho", que aprende com seus erros e acertos e a partir deles cria padrões para identificar fontes menos comuns, incluindo o maior desafio: letras escritas a mão. Mesmo assim, falhas acontecem de vez em quando, seja nas canetas mais simples, que lêem palavra por palavra, seja nas que nem se parecem com uma caneta, que conseguem escancear o texto inteiro de uma só vez. Independentemente do tamanho, o funcionamento segue sempre o mesmo esquema, confira:







A ponta da caneta, que nada mais é do que um sensor de leitura ópitca (um escâner), passa por cima do texto e o captura em forma de imagem. Para facilitar seu entendimento, é como se a ponta da caneta fotografasse o local por onde passa.
A imagem vira um bitmap, ou seja, um formato de imagem composto por pixels quadrados, alguns ativos (pretos, no caso de textos escritos em preto), outros inativos (brancos). Assim o OCR diferencia o que é texto e o que é espaço.

Identificados os pixels ativos, o OCR passa para a etapa de comparar cada conjunto de pixels com os modelos de caracteres que estão armazenados na sua memória. Por exemplo: um traço vertical com um pingo em cima só pode ser um "i".

Caractere facilmente reconhecível: a
Caractere difícil de reconhecer: a



Dependendo da memória, as canetas tradutoras podem reconhecer entre 300 mil e 500 mil palavras em média. Mais isso não é tudo e às vezes ela não reconhece. Nesse caso, o programa coloca um caractere especial (- ou #) no lugar da letra não lida.
Depois o OCR grava o resultado em um formato acessível aos processadores de texto e programas de tradução – o mais comum é o formato de texto ASCII. Como qualquer computador, a caneta tem um processador e um HD, onde os textos são armazenados.
Com o texto já destrinchado e gravado no HD, a caneta roda um software de tradução automática e mostra o resultado no visor LCD ou, em alguns modelos, em voz alta. Algumas canetas armazenam até mil páginas de texto.



































0 comentários:

Postar um comentário

Oi, obrigado (a) por deixar seu recado! Prometo responder você assim que possivel..... Desejo que volte sempre :)