PHP – PDF & Worddateien auslesen

Manchmal wäre es doch echt praktisch wenn man eine PDF-Datei mit PHP auslesen könnte. Unter PHP direkt ist mir bisher noch keine Funktion bekannt die dies direkt könnte. Sofern man aber einen Server oder ein Webhosting besitzt in dem man per PHP „system()“ Befehle ausführen darf, hat man Glück und kann mit der folgenden Funktion eine PDF-Datei per PHP auslesen:

   function GetPDFContent($filename) {
        $cmd = 'pdftotext "' . realpath(__DIR__ . '/../'. $filename) .'"';        
        system($cmd, $return);
        if($return == 0) {
            $txt = preg_replace("/\.pdf$/", "", $filename).".txt";
            $content = file_get_contents($txt);
            unlink($txt);
            return $content;
        } else {
            return false;
        }
Veröffentlicht in: PHP