|

Spracherkennungssoftware gibt es inzwischen seit mehreren Jahren.
Aber gerade am Anfang waren die Ergebnisse nicht sonderlich
berauschend. Spracherkennung ist für Computer eine relativ
schwierige Angelegenheit, da sie den Sinn des Texts, den sie
schreiben müssen, selbst nicht Wort für Wort verstehen und auch
Probleme haben, die Stimme von den Nebengeräuschen zu trennen.
Die aktuelle Version
von ScanSofts Spracherkennungssoftware NaturallySpeaking wird gleich
mit einem rauschunterdrückenden Mikrofon geliefert, das bessere
Ergebnisse, als normale Headsets liefert.
Nach der Installation
des Programms und der Einrichtung des Mikrofons muss die Software
"angelernt" werden. Man liest also einige Minuten lang einen Text
vor und der Computer "gewöhnt" sich so an die Stimme des Nutzers.
Zwar kann das Programm auch von mehreren Usern genutzt werden,
jedoch muss jeder das Programm trainieren, damit die
Stimmeigenschaften analysiert und gespeichert sind.
Nach dem kurzen Training werden alle Dokumente und E-Mails auf
Wunsch automatisch durchsucht und der Sprachstil analysiert.
Dann kann man sofort
loslegen. Eine kleine Leiste am oberen Bildschirmrand zeigt, dass
Naturally Speaking läuft und ob das Mikrofon aktiviert ist.
Naturally Speaking kann mit so gut wie allen Programmen genutzt
werden. Microsoft Word und Excel werden unterstützt.
Diktiert werden kann
ganz flüssig, so als würde man mit einer anderen Person sprechen.
Mit ausreichender Rechenleistung des Computers ist das kein Problem
mehr. Sogar die Maus kann mit Hilfe der Spracheingabe gesteuert
werden. Theoretisch kann man so ohne Tastatur und Maus arbeiten. In
der Praxis gestaltet sich das ohne Maus dann aber doch etwas
umständlich.
Die von ScanSoft
propagierten "bis zu 99%" Erkennungsgenauigkeit sind ohne
zusätzliches Training des Programms und längere Nutzungsdauer
jedenfalls nicht erreichbar. Mit der Zeit gewöhnt sich
NaturallySpeaking an den Sprecher und verringert auch die
Fehlerquote. Auch exotische Ausdrücke können trainiert werden.
In meinen Tests lag
die durchschnittliche Fehlerquote (wenn man die Eigennamen und die
Fremdwörter aus der Statistik herausnimmt) bei rund 4,5%. Also lag
die Genauigkeit bei 95,5% ohne zusätzliches Training. Bei längerem
regelmäßigen Benutzen der Software verbessert sich die
Erkennungsgenauigkeit.
Die diktierten Texte
finden Sie als Download am Ende dieser Rezension.
Die "Preferred"-Version
unterstützt auch das Einlesen von Wave-Dateien. Z.B. von einem
Pocket PC. Mit dem Pocket PC-internen Mikrofon war die Fehlerquote
in meinem Test mit 13% recht hoch.
Nachdem man den Text
diktiert hat, kann man ihn sich auch vorlesen lassen. Das hilft bei
der Fehlersuche, ist aber gerade bei langen Texten etwas
anstrengend, da die Computerstimme natürlich etwas hakelt.
Preislich liegt die
Preferred Version bei knapp 200 € und die im Funktionsumfang etwas
reduzierte Standard-Version bei knapp 100 €.
Fazit:
Wer nicht allzu ausgefallene Texte schreibt und die
Spracherkennung regelmäßig (also möglichst täglich) einsetzt, der
wird auf Dauer durchaus Zeit sparen können.
Leider ist die
Erkennung gerade ganz am Anfang noch recht fehleranfällig und die
Korrekturen beanspruchen auch ihre Zeit. Wer die Spracherkennung nur
sehr selten einsetzen will und damit eine effektive Anpassung der
Anwendung an den Wortschatze des Nutzers verhindert, ist häufig mit
der Tastatur besser beraten.
Links zum Thema:
Unsere Test-Texte:
|