El OCR

Se trata de una de las aplicaciones más comunes de los escáners. OCR son las siglas de OpticalCharacter Recognition, reconocimiento óptico de caracteres, o con una descripción más sencilla: cómo hacer para enseñar a leer al ordenador.

Si pensamos un poco en el proceso de escaneado que hemos descrito anteriormente, nos daremos cuenta de que al escanear un texto no se escanean letras, palabras y frases, sino sencillamente los puntos que las forman, una especie de fotografía del texto. Evidentemente, esto puede ser útil para archivar textos, pero sería deseable que pudiéramos coger todas esas referencias tan interesantes pero tan pesadas e incorporarlas a nuestro procesador de texto no como una imagen, sino como texto editable.

Lo que desearíamos en definitiva sería que el ordenador supiera leer como nosotros. Bueno, pues eso hace el OCR: es un programa que lee esas imágenes digitales y busca conjuntos de puntos que se asemejen a letras, a caracteres. Dependiendo de la complejidad de dicho programa entenderá más o menos tipos deltra, llegando en algunos casos a interpretar la escritura manual, mantener el formato original (columnas, fotos entre el texto…) o a aplicar reglas gramaticales para aumentar la exactitud del proceso de reconocimiento.

Para que el programa pueda realizar estas tareas con una cierta fiabilidad, sin confundir «t» con «1», por ejemplo, la imagen que le proporcionamos debe cumplir unas ciertas características.

Fundamentalmente debe tener una gran resolución, unos 300 ppp para textos con tipos de letra claros o 600 ppp si se trata de tipos de letra pequeños u originales de poca calidad como periódicos. Por contra, podemos ahorrar en el aspecto del color: casi siempre bastará con blanco y negro (1 bit de color), o a lo sumo una escala de 256 grises (8 bits). Por este motivo algunos escáners de rodillo (muy apropiados para este tipo de tareas) carecen de soporte para color.

Fuente: Apuntes de Mantenimiento Computacional de la Unideg