Hur man läser en DOC-fil med PHP

PHP-programmerare letar ofta efter sätt att utöka funktionaliteten på detta språk utanför dess komfortzon. PHP används mest på Linux-operativsystem, men besökare på PHP-webbplatser arbetar vanligtvis på Windows- eller Macintosh-system. En webbplats utformad för att ladda upp en Microsoft Word-fil från dessa användare kan behöva extrahera innehållet i den här filen och e-posta eller bearbeta dess text med PHP-algoritmer. Men Microsoft Word-filer, som slutar i DOC-tillägget, är inte inbyggda i Linux eller PHP. Att överbrygga dessa två datormiljöer är möjligt med viss förberedelse.

Steg 1

Kontrollera med din värdleverantör att PHP-åtkomst är tillgänglig för din webbplats. De flesta servrar stöder PHP, men ibland kräver denna tjänst en kontouppgradering. Du kan inte läsa en DOC-fil med PHP utan åtkomst till kompilatorn.

Steg 2

Ladda ner Antiword MS Word-dokumentläsarverktyget (se Referenser). Detta program med öppen källkod innehåller programmeringsmaterial som utökar PHP för DOC-konvertering.

Steg 3

Packa upp Antiword-arkivet för att extrahera dess innehåll.

Steg 4

Ladda upp hela Antiword-filbiblioteket till webbservern. Placera filerna i "bin" -katalogen på värdkontot. Den här katalogen är ett vanligt arkiv för verktyg och andra binära operationer som webbserveranvändare ofta måste utnyttja.

Steg 5

Ring Antiword-programmet i alla PHP-skript som är utformade för att läsa ett DOC Microsoft Word-dokument. Kommandot implementeras med en enda funktion. Skriv "$ content = shell_exec ('/ usr / local / bin / antiword'. $ Filnamn);" där "$ filnamn" motsvarar hela filnamnet på DOC-dokumentet. Innehållet i DOC-filen kommer att läsas in i variabeln "$ content". Dessa variabla namn, som börjar med symbolen "$", kan anpassas.

Bearbeta variabeln "$ content" enligt önskemål för att manipulera innehållet i DOC-filen. När DOC har lästs av PHP är hela texten i filen tillgänglig för alla former av ytterligare aktiviteter. Innehållet kan till exempel mailas eller lagras i en databas.