Saltar al contenido

Leer archivos pdf con php

Solución:

Consulte FPDF (con FPDI):

http://www.fpdf.org/

http://www.setasign.de/products/pdf-php-solutions/fpdi/

Estos le permitirán abrir un pdf y agregarle contenido en PHP. Supongo que también puede usar su funcionalidad para buscar en el contenido existente los valores que necesita.

Otra posible biblioteca es TCPDF: https://tcpdf.org/

Actualice para agregar una biblioteca más moderna: PDF Parser

Hay una biblioteca php (pdfparser) que hace exactamente lo que quieres.

sitio web del proyecto

http://www.pdfparser.org/

github

https://github.com/smalot/pdfparser

Página de demostración / api

http://www.pdfparser.org/demo

Después de incluir pdfparser en su proyecto, puede obtener todo el texto de mypdf.pdf al igual que:

<?php
$parser = new installpathPdfParserParser();
$pdf    = $parser->parseFile('mypdf.pdf');  
$text = $pdf->getText();
echo $text;//all text from mypdf.pdf

?>

De manera similar, puede obtener los metadatos del pdf, así como los objetos PDF (por ejemplo, imágenes).

No es exactamente php, pero puede ejecutar un programa desde php para convertir el pdf en un archivo html temporal y luego analizar el archivo resultante con php. Hice algo similar para un proyecto mío y este es el programa que usé:

PdfToHtml

El HTML resultante envuelve los elementos de texto en etiquetas

con coordenadas de posición absoluta. Parece que esto es exactamente lo que estás intentando hacer.

¡Haz clic para puntuar esta entrada!
(Votos: 0 Promedio: 0)


Tags : / /

Utiliza Nuestro Buscador

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *