A ponta da caneta, que nada mais é do que um sensor de leitura ópitca (um escâner), passa por cima do texto e o captura em forma de imagem. Para facilitar seu entendimento, é como se a ponta da caneta fotografasse o local por onde passa.
A imagem vira um bitmap, ou seja, um formato de imagem composto por pixels quadrados, alguns ativos (pretos, no caso de textos escritos em preto), outros inativos (brancos). Assim o OCR diferencia o que é texto e o que é espaço.
Identificados os pixels ativos, o OCR passa para a etapa de comparar cada conjunto de pixels com os modelos de caracteres que estão armazenados na sua memória. Por exemplo: um traço vertical com um pingo em cima só pode ser um "i".
Caractere facilmente reconhecível: a
Caractere difícil de reconhecer: a
Dependendo da memória, as canetas tradutoras podem reconhecer entre 300 mil e 500 mil palavras em média. Mais isso não é tudo e às vezes ela não reconhece. Nesse caso, o programa coloca um caractere especial (- ou #) no lugar da letra não lida.
Depois o OCR grava o resultado em um formato acessível aos processadores de texto e programas de tradução – o mais comum é o formato de texto ASCII. Como qualquer computador, a caneta tem um processador e um HD, onde os textos são armazenados.
Com o texto já destrinchado e gravado no HD, a caneta roda um software de tradução automática e mostra o resultado no visor LCD ou, em alguns modelos, em voz alta. Algumas canetas armazenam até mil páginas de texto.
0 comentários:
Postar um comentário
Oi, obrigado (a) por deixar seu recado! Prometo responder você assim que possivel..... Desejo que volte sempre :)