OCR

O que é OCR?

O OCR (Reconhecimento Óptico de Caracteres) é um processo pelo qual podemos extrair todo o texto de um documento digitalizado convertendo o mesmo em conteúdo pesquisável através de um software próprio ou para formatos de arquivos já conhecidos como DOC, PDF e XLS.

processo ocr

A Célula aplica esta tecnologia sobre documentos digitalizados dos mais diversos tipos: cartas, memorandos, ofícios e jornais. A tecnologia auxilia no processo de digitalização, transformação e leitura das imagens em conteúdo pesquisável permitindo a visualização dos arquivos no formato PDF/A e os termos pesquisados são hachurados em amarelo facilitando a busca do usuário pelo conteúdo pesquisado.

tela busca ocr

Figura 1: Resultados pela busca por conteúdo no sistema GED

Figura 2: Visualização do PDF/A no sistema GED