Solución:
Consulte FPDF (con FPDI):
http://www.fpdf.org/
http://www.setasign.de/products/pdf-php-solutions/fpdi/
Estos le permitirán abrir un pdf y agregarle contenido en PHP. Supongo que también puede usar su funcionalidad para buscar en el contenido existente los valores que necesita.
Otra posible biblioteca es TCPDF: https://tcpdf.org/
Actualice para agregar una biblioteca más moderna: PDF Parser
Hay una biblioteca php (pdfparser) que hace exactamente lo que quieres.
sitio web del proyecto
http://www.pdfparser.org/
github
https://github.com/smalot/pdfparser
Página de demostración / api
http://www.pdfparser.org/demo
Después de incluir pdfparser en su proyecto, puede obtener todo el texto de mypdf.pdf
al igual que:
<?php
$parser = new installpathPdfParserParser();
$pdf = $parser->parseFile('mypdf.pdf');
$text = $pdf->getText();
echo $text;//all text from mypdf.pdf
?>
De manera similar, puede obtener los metadatos del pdf, así como los objetos PDF (por ejemplo, imágenes).
No es exactamente php, pero puede ejecutar un programa desde php para convertir el pdf en un archivo html temporal y luego analizar el archivo resultante con php. Hice algo similar para un proyecto mío y este es el programa que usé:
PdfToHtml
El HTML resultante envuelve los elementos de texto en etiquetas