Saltar al contenido

Cómo averiguar por qué no se puede buscar texto en un PDF (y hacer que se pueda buscar)

Solución:

  • Puede tener una codificación de fuente personalizada que asigne puntos de código a los caracteres de una manera que sea incompatible con las codificaciones establecidas como ASCII o UTF-8 / Unicode.

  • Puede representar caracteres individualmente fuera de secuencia

  • Es posible que haya personajes aplanados en caminos

Consulte las preguntas de Stack Overflow. ¿Cómo se depuran los archivos PDF? y la codificación de fuente PDF ahora eliminada: ¿por qué no puedo copiar texto de un PDF?

Para que se pueda buscar texto, la mejor manera puede ser volver a la fuente original (por ejemplo, un documento de Word) y usar un proceso diferente para producir el PDF. Alternativamente, puede intentar renderizar su PDF actual como un mapa de bits y luego usar OCR, pero esto será tedioso y producirá malos resultados.

¡Haz clic para puntuar esta entrada!
(Votos: 0 Promedio: 0)


Tags : / /

Utiliza Nuestro Buscador

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *