No olvides que en la informática un error casi siempre tiene varias resoluciones, pero nosotros te compartiremos lo más óptimo y mejor.
Solución:
1) descargue y descomprima el archivo .exe en una carpeta: http://sourceforge.net/projects/pdftohtml/
2) cree un archivo .php y coloque este código (asumiendo que el pdftohtml.exe está dentro de esa carpeta, y la fuente sample.pdf también):
3) entrar Mi carpetay verá los archivos convertidos (depende del número de páginas…)
PD: no lo sé, pero también existen muchas API comerciales o de prueba.
Solución multiplataforma usando Xpdf:
Descargue el paquete apropiado del Herramientas Xpdf y descomprímalo en un subdirectorio en el directorio de su script. Supongamos que se llama “/xpdftools”.
Agregue dicho código en su script php:
$pdf_file = 'sample.pdf';
$html_dir = 'htmldir';
$cmd = "xpdftools/bin32/pdftohtml $pdf_file $html_dir";
exec($cmd, $out, $ret);
echo "Exit code: $ret";
Después de la ejecución exitosa del script htmldir
directorio contendrá archivos html convertidos (cada página en un archivo separado).
Las herramientas de Xpdf utilizan los siguientes códigos de salida:
0
– No hay error.1
– Error al abrir un archivo PDF.2
– Error al abrir un archivo de salida.3
– Error relacionado con los permisos de PDF.99
– Otro error.
Básicamente, lo que está buscando hacer es redistribuir el archivo PDF. No estoy seguro de que esto exista, y en el mejor de los casos es muy difícil de hacer.
Sería posible escribir algún código para hacer lo que necesita para su archivo específico, pero creo que sería imposible hacerlo para un caso general.
He escrito un artículo aquí que explica por qué creo que el reflujo de PDF es defectuoso: http://www.planetpdf.com/enterprise/article.asp?ContentID=PDF_Reflow_in_Microsoft_Word_2012_Is_it_any_good
De particular interés es el párrafo que comienza “Usemos una historia de periódico para ilustrar el problema”.
Es posible que desee ver qué ofrece IDRsolutions (que, por transparencia, ¡es donde trabajo!) tiene para ofrecer.
Actualmente estamos en el proceso de colocar nuestro software de conversión de PDF a HTML5 y PDF en la nube: http://www.idrsolutions.com/cloud-pdf-converter/
Lo que puede ser más adecuado para usted es la función de extracción de texto PDF y extracción de imágenes PDF de JPedal. Es muy probable que también consideremos poner esto en la nube, si el PDF a HTML5 funciona bien.
Extracción de texto: http://www.idrsolutions.com/pdf-to-text-conversion/
Extracción de imágenes: http://www.idrsolutions.com/extract-images-from-pdf/
Al final de la artículo puedes encontrar las acotaciones de otros creadores, tú asimismo puedes dejar el tuyo si te gusta.