Anzeige

Tutorial: Office 2007 Dateien auf dem Mac lesen

Office 2007Nachdem das Standarddateiformat von Microsoft Office einige Jahre stabil geblieben ist, setzt Microsoft mit der neuen Office 2007 Suite erneut auf ein neues Format. Ein neuer ECMA-Standard scheint es Microsoft wert zu sein, die bisherige Kompatibilität über den Haufen zu werfen und weitere Inkompatibilitäten zum OASIS-Standard, der von den Open-Office-Entwicklern kreiert wurde, hinzunehmen.

Seit ein paar Tagen ist Office 2007 erhältlich und damit stellt sich zumindest für Mac-Benutzer die Frage, wie sie die neuen Formate verarbeiten können. Für Office 2003 (Windows) stellt Microsoft ein Konverterplugin zur Verfügung, aber die Macintosh Business Unit in Redmond stellt einen solchen Konverter für Mac OS X erst für April 2007 in Aussicht. Im selben Zeitraum wird wahrscheinlich auch Mac OS X Leopard erscheinen und vermutlich auch Unterstützung für die neuen Formate mitbringen.

Doch was tun, wenn man nicht auf Leopard oder Microsoft warten kann und Office 2007 Dateien jetzt verarbeiten können muss? Zumindest für Word-Dateien im docx-Format gibt es m Eightsevenfour-Blog eine Anleitung, wie man wenigstens an den Text des Dokuments gelangen kann.

Workaround
Die docx-Datei ist eigentlich eine normal ZIP-komprimierte Datei. Als erstes ändert man die Dateierweiterung von docx in zip. Danach kann man im Finder die ZIP-Datei auspacken. Darin befindet sich eine XML-Datei, deren Inhalt im letzten Schritt benötigt wird. Nimmt man den Inhalt und fügt ihn für die $text-Variable des folgenden PHP-Scripts ein, dann erhält man den Klartext des Dokuments ohne jegliche Formatierungen.

<?php
$text = ‘ ‘;
strip_tags($text);
echo $text;
?>

Einfacher geht es mit diesem Automator-Script, welches einem all diese Schritte abnimmt. Diese Vorgehensweise funktioniert übrigens auch mit dem neuen XML-Format von Open Office.

Fazit
Für Mac OS X Benutzer gibt es bislang keine vernünftige Möglichkeit mit den neuen Office-Formaten zu arbeiten. Am wahrscheinlichsten ist es, dass in wenigen Wochen Open Office Unterstützung für die Microsoft-XML-Formate bringen wird und damit auch auf dem Mac eine Verarbeitung der neuen Dateien möglich ist. Bis dahin bleibt nur der Weg den Klartext zu extrahieren.

Matthias Lange
Autor:
Datum:
Kategorie:
Tags:
Matthias Lange, Redakteur
10.12.2006, 23:15 Uhr
Software
, ,  

1 Trackback

  1. Profilbild

    [...] Erweitert Vor ein paar Tagen haben wir über die Möglichkeit berichtet den Text aus dem neuen docx-Format von Office 2007 zu extrahieren. Der darin erwähnte Docx-Converter wurde weiterentwickelt und kann jetzt auch einfachste Formatierungen (Fett- und Kursivschrifft) sowie Textausrichtungen und einfache Tabellen extrahieren. Das Ergebnis wird als HTML-Datei ausgeben. [...]


Anzeige

Dein Kommentar:

Mit einem Facebook-Account kannst du dich auch auf Macnotes anmelden:
Connect with Facebook


  

Mein Macnotes

Daten merken

Neu hier? Ein Macnotes-Account bringt dir viele Vorteile

Anzeige
blogoscoop