Saltar al contenido

Texto borroso en PDF

Posterior a de esta larga búsqueda de información resolvimos esta interrogante que suelen tener muchos los usuarios. Te ofrecemos la solución y nuestro deseo es resultarte de mucha ayuda.

Solución:

Esta es una capa ráster que, desafortunadamente, también contiene texto. Podría decirse que la forma más sencilla de corregir dicho PDF sería usar ABBYY FineReader (comercial, funciona en Windows, Linux, mac OS). Los archivos PDF o de imagen se cargan y procesan de acuerdo con el escenario deseado. Por ejemplo, aquí realmente no necesitamos procesamiento previo y OCR funciona bien después de elegir el idioma inglés para el documento:

ingrese la descripción de la imagen aquí

Al guardar un documento reconocido, asegúrese de seleccionar Solo texto e imágenes en la sección Modo Guardar:

ingrese la descripción de la imagen aquí

Esto daría como resultado un PDF “limpio” con fuentes vectoriales escalables sin pixelización:

ingrese la descripción de la imagen aquí

Alternativamente, también se pueden usar otras herramientas de OCR gratuitas y de código abierto como tesseract/Capture2Text/NAPS2 y usar LibreOffice Writer/LaTeX para crear un nuevo PDF usando texto reconocido.

El texto ha sido rasterizado – convertido en ‘puntos’.

Todavía debería ser vectorial, usando fuentes reales que se dibujan en vivo en la pantalla.

Esto podría deberse a que el documento se escaneó y en realidad es solo una foto, o porque en algún momento de su historial faltaba la fuente esperada.

La única solución real sería encontrar una aplicación OCR (reconocimiento óptico de caracteres) y volver a escanearla.

Existe otra posibilidad para la causa de la borrosidad: una capa de filtro colocada sobre la capa ráster escaneada.

Trabajé en un lugar hace algunos años que tenía escáneres de documentos en la red. Escaneó sus cosas y el escáner le envió la copia por correo electrónico, o podría enviarla directamente a la dirección de correo electrónico de otra persona.

Ocasionalmente, los escaneos de documentos de texto saldrían muy borrosos. Como la persona con más conocimientos de TI disponible, me quedé atascado tratando de averiguar cuál era el problema.

Resultó que el escáner identificaba incorrectamente el texto como una imagen e insertaba un filtro encima para reducir el efecto muaré que resulta de los puntos de las imágenes de medios tonos y la resolución del escáner.

Puede corregir esos escaneos de texto borrosos usando un editor de PDF para eliminar la capa de filtro sobre el texto.

Nunca supe por qué algunos escaneos tenían el filtro y otros no. Algún error o caso extremo en el algoritmo de reconocimiento de medios tonos, quién sabe.

Su borrosidad probablemente no sea causada por un filtro, pero es algo a tener en cuenta.

Si posees alguna desconfianza o capacidad de ascender nuestro ensayo puedes dejar una nota y con deseo lo leeremos.

¡Haz clic para puntuar esta entrada!
(Votos: 0 Promedio: 0)


Tags : / /

Utiliza Nuestro Buscador

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *