So lesen Sie eine DOC-Datei mit PHP

PHP-Programmierer suchen oft nach Möglichkeiten, die Funktionalität dieser Sprache außerhalb ihrer Komfortzone zu erweitern. PHP wird hauptsächlich auf Linux-Betriebssystemen verwendet, aber die Besucher von PHP-Websites arbeiten normalerweise auf Windows- oder Macintosh-Systemen. Eine Website, die zum Hochladen einer Microsoft Word-Datei von diesen Benutzern entwickelt wurde, muss möglicherweise den Inhalt dieser Datei extrahieren und ihren Text per E-Mail oder mit PHP-Algorithmen verarbeiten. Aber Microsoft Word-Dateien, die mit der Erweiterung DOC enden, sind nicht nativ für Linux oder PHP. Die Überbrückung dieser beiden Computerumgebungen ist mit etwas Vorbereitung möglich.

Schritt 1

Überprüfen Sie bei Ihrem Hostanbieter, ob für Ihre Website ein PHP-Zugang verfügbar ist. Die meisten Server unterstützen PHP, aber gelegentlich erfordert dieser Dienst ein Konto-Upgrade. Sie können eine DOC-Datei mit PHP nicht ohne Zugriff auf den Compiler lesen.

Schritt 2

Laden Sie das Dienstprogramm zum Lesen von Antiword MS Word-Dokumenten herunter (siehe Referenzen). Dieses Open-Source-Programm enthält Programmiermaterialien, die PHP für die DOC-Konvertierung erweitern.

Schritt 3

Entpacken Sie das Antiword-Archiv, um seinen Inhalt zu extrahieren.

Schritt 4

Laden Sie die gesamte Antiword-Dateibibliothek auf den Webserver hoch. Legen Sie die Dateien in das Verzeichnis "bin" des Host-Kontos. Dieses Verzeichnis ist ein gemeinsames Repository für Dienstprogramme und andere binäre Operationen, die Webserverbenutzer häufig ausnutzen müssen.

Schritt 5

Rufen Sie das Antiword-Programm in einem beliebigen PHP-Skript auf, das zum Lesen eines DOC Microsoft Word-Dokuments entwickelt wurde. Der Befehl wird mit einer einzigen Funktion implementiert. Geben Sie "$content = shell_exec('/usr/local/bin/antiword '.$filename);" wobei "$filename" dem vollständigen Dateinamen des DOC-Dokuments entspricht. Der Inhalt der DOC-Datei wird in die Variable "$content" eingelesen. Diese Variablennamen, beginnend mit dem "$"-Symbol, sind anpassbar.

Bearbeiten Sie die Variable "$content" wie gewünscht, um den Inhalt der DOC-Datei zu manipulieren. Sobald das DOC von PHP gelesen wurde, steht der Volltext der Datei für jede Form von weiteren Aktivitäten zur Verfügung. Die Inhalte können beispielsweise per E-Mail versendet oder in einer Datenbank gespeichert werden.