Test: MacSpeech Dictate deutsche Version

mz, den 12. Oktober 2009
MacSpeech Dictate
MacSpeech Dictate, Screenshot

Die Spacherkennungssoftware „Dictate“ der amerikanischen Entwicklerfirma MacSpeech ist gründlich für den deutschen Markt lokalisiert worden und bietet nun auch hierzulande die Möglichkeit, Texte, E-Mails und andere Dokumente vollständig per Sprache zu steuern. Wir haben die vielversprechende Komplettlösung getestet.

Auspacken und Vorbereiten

Wie bereits letzte Woche angekündigt, liegt uns MacSpeech Dictate nun in der deutschen Lokalisierung vor. Diese wurde vom Distributor Application Systems Heidelberg (ASH) vorgenommen. Im Paket befinden sich zwei DVDs, von denen eine zur Installation und die zweite zur anschließenden Wörterbuchinstallation zuständig ist. Außerdem dabei ist eine Karte mit dem sogenannten Tauschcode, der zur Registrierung (und damit auch zur Erstellung eines Nutzerprofils) notwendig ist, und ein Headset, welches vom Hersteller MacSpeech speziell zur Benutzung mit Dictate zertifiziert wurde – in unserem Fall ein Modell von Plantronics.

Das Headset wird über USB mit dem Rechner verbunden, die Software installiert sich standardmäßig in den „Programme“-Ordner und verlangt zur Erstellung eines Profils nach der Daten-DVD. Das Einlesen der notwendigen Datensätze dauerte bei unserem Test zwischen 20 und 25 Minuten, während derer man die App nicht nutzen kann. Danach wird ein Profil erstellt und es geht ans Training.

Über das standardmäßig eingeblendete Optionsfenster lassen sich der aktuelle Betriebsmodus und die Eingabelautstärke ablesen sowie das Mikrofon ein- oder ausschalten, darunter wird jeweils der Titel des aktiven Fensters angezeigt, damit man weiß, worauf der nächste Befehl angewendet wird. Ein Button zum Aktivieren bzw. Deaktivieren des Mikrofons findet sich auch in der Taskleiste.

Sprachtraining

Bevor es richtig losgehen kann, muss ein solch komplexes System wie Dictate erst einmal ein wenig mit der Stimme des Nutzers vertraut gemacht werden. Im Programm integriert sind drei Trainingstexte, die über zusätzliche TXT-Dateien erweitert werden können. Der erste ist der Willkommenstext, der klugerweise durch Vorlesen einer allgemeinen Einführung die Anwendungsbereiche und Funktionsweise der Software erklärt und dabei gleichzeitig die Spracherkennung grundlegend trainiert. Um einen möglichst unkomplizierten Einstieg zu gewährleisten, empfiehlt es sich aber, die beiden anderen Texte zusätzlich zu lesen. Zur Auswahl stehen Auszüge aus dem Märchen von den Bremer Stadtmusikanten sowie aus „Reihenweise Individualisten“ von Stefanie Dracker.

Hat die Software den vorgelesenen Text erfolgreich mit dem vorgespeicherten Inhalt verglichen, ändert sich die Textfarbe zu grün und es geht mit dem nächsten Satz weiter. Wenn Dictate den Nutzer nicht verstanden hat, wird der vorgelesene Textteil rot und man muss sich wiederholen. Die Beispieltexte werden allesamt sehr gut erkannt und so freut man sich dann darauf, seine erste E-Mail mit Dictate zu schreiben.

Die drei Betriebsmodi

Die Software kann zur optimalen Nutzung in drei verschiedenen Modi verwendet werden. Neben dem reinen Diktatmodus gibt es außerdem die Möglichkeit, schwierige Wörter in einzelnen Buchstaben zu diktieren, und einen Befehlsmodus, über dem man den Mac nahezu vollständig über Spracheingaben steuern kann.

In allen drei Modi gilt: Das Handbuch sollte vorher gründlich gelesen und die grundlegenden Befehle gelernt werden. Trotz intuitiver Steuerung kann man als Nutzer nicht immer wissen, ob es nun „Computer neu starten“ oder „Neustart Computer“ heißen muss. Das macht durchaus einen Unterschied, denn Dictate nimmt gesprochene Befehle als reinen Text auf, wenn sie nicht erkannt wurden. Es gibt allerdings die Möglichkeit, selbst neue Befehle zu definieren, die man dann mit den Worten beschreiben kann, die man selbst benutzen würde.

Das Diktat

Zwar kann in jedem Texteingabefenster auf dem Mac mit Dictate gearbeitet werden, allerdings wird der diktierte Text nur im programmeigenen Diktatfenster mit einem besonderen Index versehen, der es dem Nutzer ermöglicht, auch über die Tastatur Korrekturen vorzunehmen, um in Anschluss über die Spracheingabe weiter zu arbeiten. Versucht man in einem E-Mail-Fenster beispielsweise, ein Wort per Tastatur zu korrigieren, kann man im Anschluss mit dem Sprachbefehl „Gehe X Wörter zurück“ nicht mehr weiter als zu diesem Wort zurückspringen. Um auf Nummer sicher zu gehen, sollte man seine Texte also im MacSpeech-Diktatfenster vordiktieren und dann in das gewünschte Programm kopieren.

Zunächst hatten wir einige Schwierigkeiten mit der genauen Erkennung, da bestimmte Details wie die Unterscheidung von Singular und Plural oder ähnlich klingende Silben wie „en“ oder „an“ ab und zu verwechselt werden. Ein Tipp an dieser Stelle ist folgender: In den Einstellungen gibt es einen Schieberegler, mit dem sich festlegen lässt, ob größeres Gewicht auf der Geschwindigkeit oder auf der Genauigkeit der Spracherkennung gelegt werden soll. Setzt man auf die Genauigkeit, wird die Erkennung deutlich verbessert und man spart sich einiges an anschließender Korrekturarbeit.

Besonders interessant: Nicht nur die deutsche Sprache wird von MacSpeech Dictate unterstützt, auch in Englisch, Französisch oder Italienisch kann ebenso problemlos diktiert werden. Damit eignet sich die Software für fremdsprachliche Texte und Übersetzungen.

Zusätzliche Funktionen

Neben der selbstverständlichen Unterstützung verschiedener Profile für mehrere Nutzer, um die Erkennungsgenauigkeit zu optimieren, kann MacSpeech Dictate aber noch vieles mehr. Es können sich Textbausteine vordefinieren lassen und bei Bedarf in längere Texte einfügen lassen. Außerdem wird AppleScript unterstützt, so dass man entweder Dictate mit vorgefertigen Scripts steuern oder beliebige Scripts mit Dictate-Sprachbefehlen starten kann.

Dictate arbeitet laut Hersteller mit fast allen Programmen zusammen, die man sich nur vorstellen kann. Über die globalen und app-spezifischen Befehlssätze kann von Apple-eigener Software wie iWork oder iLife über Microsoft Office bis hin zu Profi-Anwendungen wie Adobe Photoshop nahezu jede App per Sprache gesteuert werden. Dabei ist die Spracherkennungslösung ebenso individuell wie vielseitig: Nicht nur eigene Befehle können konfiguriert werden, auch der Wortschatz erweitert sich im Diktatmodus ständig weiter und je mehr Texte diktiert wurden, desto genauer funktioniert die Spracherkennung mit der Zeit.

Darüber hinaus bietet Dictate aber auch die Möglichkeit, einzelne Wörter außerhalb von Texten zu trainieren oder hinzuzufügen. Im Wortschatz-Editor können alle Befehle, Wörter, Zeichen sowie besondere Textelemente wie Smileys einzeln geübt und eingearbeitet werden.

Voraussetzungen

Für die Installation von MacSpeech Dictate notwendig ist ein Intel-basierter Mac mit mindestens OS X 10.5, 2GB freier Festplattenspeicher und 1GB RAM sowie ein DVD-Laufwerk. Da Dictate eine sehr rechenintensive Anwendung ist, empfehlen sich allerdings 2GB RAM und ein Core 2 Duo-Prozessor, sonst kann es öfter zu kleineren Hängern kommen.

Für die Nutzung der Software ist außerdem ein MacSpeech-zertifiziertes Headset nötig, welches in der uns vorliegenden Testversion bereits enthalten war.Wer bereits über ein externes Mikrofon verfügt, kann auf der Distributor-Homepage die Kompatibilität überprüfen.

Fazit

Mit MacSpeech Dictate hält nun endlich die erste vollständig in deutscher Sprache lokalisierte Spracherkennungs und -steuerungssoftware Einzug in die Mac OS X-Umgebung. Die Software funktioniert zuverlässig, bietet einen äußerst großen Funktionsumfang und ist individuell an den persönlichen Geschmack des Nutzers anpassbar.
Wunder kann man indes von der Spracherkennung nicht erwarten: Viele Formatierungen und sinnvolle Befehle müssen zum einen erst vom Anwender gelernt werden, zum anderen ist die Zeitersparnis nur dann wirklich deutlich, wenn die Erkennung einwandfrei funktioniert – und das erfordert zunächst viel Übung. Ganz ohne Tastatur kommt man folgerichtig auch mit MacSpeech Dictate nicht aus.

Zudem muss der Mac-Anwender für die Erstanschaffung der Komplettlösung ein Stück weit in die Tasche greifen: Das Paket inklusive zertifiziertem USB-Headset kostet bei Application Systems Heidelberg gute 229€. Bisher ist es laut Auskunft der Entwickler nicht möglich, das in vielen Macs bereits integrierte Mikrofon zur Spracheingabe vernünftig zu verwenden. Wer also auch unterwegs diktieren möchte, muss das Headset immer dabei haben.

ASH hat uns aber mitgeteilt, dass bereits an umfangreichen Updates gearbeitet wird, um die Integration in die Mac-Arbeitsumgebung und die Fähigkeiten der Software weiter zu verbessern.


Ähnliche Nachrichten

Testergebnis

URS: 4,5 von 10
4,5

Positives

  • vollständig lokalisiert

Negatives

  • hohe Lernkurve
  • hohe Anschaffungskosten