Dragon NaturallySpeaking 11 - Spracherkennung im Test

Nuance Dragon Naturally Speaking 11 - © Christine de Marsouin
Nuance Dragon Naturally Speaking 11 - © Christine de Marsouin
Testbericht Nuance Dragon NaturallySpeaking 11.

Dragon NaturallySpeaking Version 11 soll laut Hersteller Nuance dreimal so schnell und genauso gut wie Tippen sein. Auch könne man jederzeit nebenbei diktieren, zum Beispiel beim Auto fahren. Dieser Test untersucht, inwieweit dies den Tatsachen entspricht.

Erfahrungen mit Dragon NaturallySpeaking 11, dem Spracherkennungsprogramm von Nuance

Getestet wurde die Funktionalität von Dragon NaturallySpeaking 11 Basic einmal auf einem Laptop mit Windows Vista mit 1 GB RAM und einmal auf einem Netbook mit Windows 7 und 2 GB RAM, also jeweils mit den Minimal-Voraussetzungen an Arbeitsspeicher. Trainiert wurde die vorgeschriebene Mindestzeit von vier Minuten, zusätzlich wurden wie empfohlen vorhandene Dokumente eingespeist.

Entscheidend für Spracherkennung sind optimale Voraussetzungen

Die Ergebnisse hingen sehr stark von den Umgebungsgeräuschen, der Haltung, Lautstärke und Klarheit der Stimme und dem perfekten Sitz des Kopfhörers ab. Relativ leise gesprochen, im Sessel bequem zurück gelehnt mit gesenktem Kopf bei lautem Laufgeräusch des Laptops, leisen Stimmen im Hintergrund und dem Mikrofon nicht exakt einen Daumen breit vor dem Mund, waren die Ergebnisse katastrophal. Das Programm tippte zwar, aber oft nur ähnlich klingende Wörter und nicht genau die gesagten. Zudem war es sehr langsam, verglich lange mögliche gemeinte Wortkombinationen.

Im aufrechten Sitz, mit lauter, klarer, gleichmäßiger Stimme ohne besondere Betonung , keinerlei Hintergrundgeräuschen und perfekt austariertem Mikrofon zeigte Dragon NaturallySpeaking 11 deutlich bessere Ergebnisse, sowohl in der Auswahl der richtigen Wörter als auch in der Geschwindigkeit. Aber auch so war das Ergebnis zunächst nicht zufriedenstellend. Erst nach dem optionalem Zusatz-Training und ständigem Eingeben von Wörtern und Wortkombinationen wurde es immer besser. Viele Wörter und Wortkombinationen sind dem Spracherkennungsprogramm zunächst nicht bekannt, können aber über Dokumente und während des Diktats eingespeist werden. Das ist anfangs sehr viel Arbeit, wird naturgemäß aber immer weniger.

Ein Spracherkennungsprogramm ist keine Schreibkraft

Zu beachten ist, dass alles mitgeschrieben wird. Wirklich alles. Das Programm ist keine Sekretärin, besitzt keine Intelligenz und kann nicht unterscheiden, was geschrieben werden soll und was nicht. Verhaspelt oder verspricht man sich - und mit Dragon NaturallySpeaking merkt man erst, wie unglaublich oft das vorkommt - schreibt das Programm jeden Versprecher mit. Es versteht nicht wie eine menschliche Schreibkraft, dass es sich um einen Versprecher handelt. Oder wenn einem im letzten Moment eine noch bessere Formulierung einfällt, man die erste aber schon ausgesprochen hat - das Sprachprogramm tippt dann beide Versionen. Zwar kann man per Sprachbefehl "Streich das!" wieder löschen, doch das ist sehr aufwendig. Oder spricht man zum Beispiel kurz ein paar Worte mit einem Kollegen, wird jedes Wort getippt, wenn man nicht zuvor per Zuruf „Geh schlafen!“ die Schreibpause einleitet. Auch muss man im Unterschied zum Diktat mit einer Schreibkraft jedes Satzzeichen mitdiktieren. Das Programm macht, was man ihm sagt, nicht mehr und nicht weniger.

Testergebnis Dragon NaturallySpeaking 11 Basic: Trainieren, Trainieren, Trainieren

Fazit: Anfangs ist ein Diktat mit Dragon NaturallySpeaking 11 weit aufwendiger als selbst zu tippen. Nach ein paar Tagen oder Wochen intensiver Arbeit, Geduld und Trainieren des Systems mit für den User typischen Formulierungen und Sprechweisen sowie der Beachtung einer klaren, gleichmäßigen Aussprache bei Vermeidung von Hintergrundgeräuschen liefert Dragon NaturallySpeaking 11 ein zufriedenstellendes Ergebnis. Allerdings muss dazu nicht nur das Programm trainiert werden, sondern auch der User. Er muss lernen, laut, deutlich, gleichmäßig, ohne Versprecher und Verhaspler zu sprechen und auf Anhieb die optimale Formulierung zu finden, permanent neue Worte und zusammenhängende Wortgruppen einzuspeisen und Fehler nicht nur im Script, sondern auch im Datenspeicher zu verbessern, denn das Sprachprogramm arbeitet mit der Erkennung von Wortzusammenhängen.

Der Nachteil ist, dass das Training nicht übertragbar ist. Aufgrund der unterschiedlichen Eigenarten in Aussprache und Formulierung muss jeder User einzeln das Programm trainieren. Beim Korrigieren per Sprachbefehl fällt auf, dass das in Word sehr gut funktioniert, in Firefox jedoch nur mangelhaft. Hier empfiehlt es sich zu Anfang, bis das Programm ausreichend trainiert ist, in Word zu schreiben und den Text dann in einen Browser zu kopieren. In Windows Live mail funktionierte das Programm überhaupt nicht. Auch hier müsste in Word vorgeschrieben und dann kopiert werden.

Für Behinderte ist das Programm bedingt geeignet. Zwar bietet es eine große Erleichterung bei Behinderungen an den Händen, jedoch kommt man nicht völlig ohne die Hände aus, da man den ein oder anderen Befehl, der nicht verstanden wurde, dann doch manuell eingeben muss. Bei einem perfekt trainierten Programm mag sich das geben.

Erhältlich als Download und CD - Systemvoraussetzungen laut Hersteller Nuance

Dragon NaturallySpeaking 11 gibt es in den Versionen Basic, Home und Premium per Download und als CD. Spezialversionen von Premium sind Student/Teacher, Mobile, Wireless und Dictate für den Mac. Bei der CD ist ein Headset dabei, der beim Download naturgemäß fehlt. Dafür erübrigt sich per Download ein externes DVD-Laufwerk bei Netbooks.

Die Systemvoraussetzungen laut Hersteller sind:

  • Prozessor: Mindestens Intel® Pentium® oder äquivalenter AMD-Prozessor mit 1 GHz oder Intel® Atom® mit 1,66 GHz. Wir empfehlen Intel Dual Core oder äquivalenten AMD-Prozessor mit 1,8 GHz. (WICHTIG: SSE2-Befehlssatz erforderlich)
  • Prozessor-Cache: Mindestens 512 KB. Zu empfehlen sind 2 MB.
  • Freier Festplattenspeicher: 2,8 GB
  • Unterstützte Betriebssysteme: Windows XP und Windows Vista und 4 GB für Windows 7 und Windows Server 2003/2008 64-Bit
  • Arbeitsspeicher: Mindestens 1 GB für Windows XP und Windows Vista und 2 GB für Windows 7 und Windows Server 2003/2008. Wir empfehlen 2 GB RAM für
  • Microsoft Internet Explorer 6 oder höher (kostenloser Download unter www.microsoft.de)
  • Creative® Labs Sound Blaster® 16 oder gleichwertige Soundkarte für 16-Bit-Aufzeichnung

Dragon weist ausdrücklich darauf hin, dass diese Edition von Dragon NaturallySpeaking nicht für den Einsatz mit Patientenverwaltungssystemen (EMR) zertifiziert ist. Eine EMR-Zertifizierung bietet nur Dragon NaturallySpeaking Medical.