CÓMO EXTRAER TEXTOS DE DOCUMENTOS ESCANEADOS

Cómo extraer textos de documentos escaneados

Manejar documentos escaneados es algo muy común, ya que es una forma fácil y eficaz de mover o compartir en formato digital los textos que ya han sido impresos previamente.

Es habitual que, en muchos trabajos, o para muchas tareas, necesites extraer los textos de algunos documentos previamente escaneados. Tal vez tengas que hacerlo y no sepas cómo o, simplemente, desconocías que esto fuera algo posible. Sea cual sea tu caso, aquí te vamos a contar cómo hacerlo de un modo fácil y eficaz y, del mismo modo, las aplicaciones que le puedes dar a esta interesante herramienta.

¿Qué es OCR?

Si te pones a investigar cómo extraer el texto de un documento ya impreso a través del escáner, lo primero que tendrás que aprender es lo que es un software OCR(Reconocimiento Óptico de Caracteres, en inglés). Esto es, simplemente, un tipo de programas que permiten identificar los caracteres escritos en un documento y codificarlos de modo que el ordenador los pueda trabajar como texto y no como imagen, con el fin de se puedan editar fácilmente a posteriori. Como ves, es algo que no tiene por qué estar en el escáner o multifunción, sino que es un programa aparte.

Aunque te pueda parecer muy especializado, el uso de un OCR es algo cada vez más extendido y que ha ido perfeccionándose con el paso de los años, por lo que, si tienes alguna duda de su eficacia, solo tienes que probar alguno y comprobar lo bien que funcionan la mayoría de las veces.

¿Se pueden extraer todo tipo de textos con un programa OCR?

Seguramente ésta sea la primera pregunta que te venga a la cabeza al oír hablar de un OCR. Incluso es probable que hace unos años tuvieras un primer contacto con programas de reconocimiento de caracteres y vieras que no eran lo suficientemente eficaces, porque confundían multitud de caracteres. Al final, esto podía provocar que pasaras más tiempo corrigiendo sus fallos que trascribiendo directamente el documento impreso, y acababas dejando a un lado el programa.

Pero tenemos buenas noticias. Hoy en día, los programas OCR han logrado la potencia necesaria para ser capaces de reconocer de un modo solvente la mayoría de los caracteres impresos en un documento. Es más, algunos de los softwares OCR más potentes también son capaces de reconocer textos manuscritos, aunque en estos casos también influye mucho la caligrafía de cada persona.

¿Cómo se utiliza un OCR para extraer textos de documentos escaneados?

No hay un único programa OCR para extraer textos, ni todos son iguales. En principio, y como norma general, estos programas –o aplicaciones– se han de obtener de un modo externo a la impresora multifunción o escáner. Las opciones son muchas, y van desde las gratuitas y online a las de pago con un tono mucho más profesional, que se instalan en el equipo como otros programas tradicionales.

En el caso de los dispositivos Brother, las impresoras multifunción de gama media-alta y los escáneres incluyen un programa de gestión documental que permite realizar OCR al digitalizar documentos.

Para escanear a OCR desde un equipo Brother, se puede hacer de distintas maneras. Se puede hacer el escaneo directamente desde el equipo, normalmente cuando incluyen una pantalla.

Desde el ordenador, también se puede hacer, con el programa incluido en los equipos Brother Control Center 4, en el caso de ordenadores con sistema operativo Windows, y con Control Center 2 en el caso de ordenadores Mac.

Por otro lado, también se puede realizar el escaneo a OCR con softwares de gestión documental, como PaperPort y Page Manager.

Y, por último, cabe destacar que algunos modelos también disponen de una Brother Appque permite hacer un escaneado a OCR: Brother Office Doc Creator. Con esta app, se puede convertir el documento a formato Word, Excel o PowerPoint y, a continuación, editar el texto, manteniendo la mayor parte del diseño del documento original.

Si tu equipo Brother no es de los que incluye estos programas para hacer OCR en tus escaneos, no te preocupes. Como te decíamos anteriormente, podrás utilizar un montón de aplicaciones y programas de los que están disponibles en internet para su descarga o su compra. Las impresoras multifunción y escáneres Brother son compatibles con la gran mayoría de estos programas, por lo que ya no tendrás excusa para realizar un reconocimiento óptico de caracteres con tus próximos escaneos.

facebookinstagram youtubelinkedin google plus