Auf dem Weg zum Natural User Interface (Teil2) – Die Spracherkennung

Technik

Mrz 22

2012

Spracherkennung

creative commons, freie Bilder Autor: Mustafa Khayat

Der Drang, die Bedienbarkeit von Geräten, wie dem PC, zu verbessern, ist groß. Dementsprechend geht die Entwicklung von Programmoberflächen für eine bessere Steuerung rasch voran. Wie im ersten Teil beschrieben, bewegen wir uns in die Richtung, Geräte mittels Gesten und Sprache zu steuern. Noch befinden wir uns in der Startphase, dennoch gibt es schon jetzt viele attraktive Techniken für den Haushaltsgebrauch. Eine dieser Innovationen möchte ich euch etwas genauer vorstellen: Die Spracherkennung (VUI). 

Siri ist eines von Apples neusten Softwareschmuckstücken auf dem Markt, integriert auf dem iPhone4S. Das ist ein Programm zur Erkennung der Sprache, wodurch anhand von Worten bzw. Sätzen, Befehle ausgeführt werden können. Ziel ist es, eine Konversation zwischen PC und Mensch herzustellen, wie es auch bei einer Unterhaltung von Mensch zu Mensch geschieht. Dabei muss beachtet werden, dass der Computer zum Verständnis der Sprache Schallwellen analysieren muss. Erst durch Siri haben die meisten Menschen die Möglichkeiten einer Spracherkennungssoftware kennengelernt. Dabei gibt es derartige Software bereits seit längerem. Die Idee der Spracherkennung ist zurückzuführen auf die Telefondienste. Ganz besonders Bestellhotlines, bei denen immer wieder die gleiche Prozedur abläuft: Artikelnummer, Kontonummer und Namen angeben. Mit der Spracherkennung ist eine Automation für diesen Bereich kein Problem. Die Anwendungsgebiete solcher Programme breiten sich immer weiter aus. In den USA ist die Software “Dragon” weit verbreitet und dient dem Diktieren. Mit Siri werden heute bereits komplexere Sätze interpretiert und in Befehle, wie einen Termin eintragen, umgewandelt.

Es gibt auch eine kostenlose Software, die Spracherkennung von Windows, zum ausprobieren und spielen -ideal. Ich habe mir das Ganze ein wenig angeschaut und für euch getestet und muss sagen, es macht Spaß. Zu finden ist die Software unter Start –> Systemsteuerung –> Spracherkennung (Windows 7 Professional). Zuallererst wird das Mikro eingerichtet, danach sollte man das Lernprogramm starten. Dort lernt ihr die wichtigsten Befehle kennen und gewöhnt euch an die Steuerung. Während ihr die Bedienung mit Hilfe eurer Stimme austestet, lernt der Computer bereits sich auf euch einzustimmen. Deswegen gibt es noch weitere Trainingsprogramme, in denen ihr dem Computer Sätze diktiert. Der PC merkt sich euer Verhalten, sprich die verschiedenen Frequenzen der Aussprache von Wörtern. Auch indem ihr Sätze korrigiert, die der Computer falsch interpretiert hatte, lernt er immer dazu. Dieser Artikel hier ist zum Großteil allein mit Hilfe des Diktierens durch die Spracherkennung entstanden. Worte, wie “Siri” oder “Apple”, kannte das Programm noch nicht. Aus Siri wurde “sieh richtig”, mit den Sprachbefehlen: “sieh richtig korrigieren” –> “Buchstabieren” –> “S-i-r-i” –> “OK”, hat der Computer dazugelernt und ab sofort auch korrekt erkannt. Man muss sich zwar erst an diese Art der Steuerung gewöhnen und dem PC auch ein wenig Zeit geben, bis er die Dinge immer korrekt erkennt, aber es macht einen Heiden Spaß!

Noch mehr Spaß macht die kostenlose Erweiterung von Microsoft namens Windows Speech Recognition Macros. Durch die eigenständige Programmierung von Makros sind der Steuerung durch Sprache keine Grenzen mehr gesetzt. Man kann damit z.B. den Rechner mit eigener Stimme auf Worte reagieren lassen und sich so mit ihm “unterhalten”. Es lassen sich alle weiteren Programme damit ansteuern, Musik kann ausgewählt werden, das Wetter angezeigt werden, etc. Durch das Schreiben von Befehlen mittels XML kann alles realisiert werden. Hier ein kleines Beispiel, welches ich geschrieben habe, um eine nette Begrüßung vom PC zurückzubekommen:

<speechMacros>
  <command>
    <listenFor>Hallo</listenFor>
    <listenFor>Guten Morgen</listenFor>
    <listenFor>Guten Abend</listenFor>
    <speak>Hello Skatze, how are you?</speak>
  </command>
</speechMacros>

Dieses kleine Programm begrüßt und fragt mich, wie es mir geht, sobald ich “Hallo”, “Guten Abend” oder “Guten Morgen” sage. Wer sich damit wirklich intensiv beschäftigt, der kann seinen Rechner zu einer Kommandozentrale machen. Für den alltäglichen Gebrauch, bzw. für die Arbeit am Rechner ist die Technik jedoch noch nicht ausgereift, aber trotzdem meiner Meinung nach schon ein großer Schritt Richtung Zukunft!

Hinterlasse ein Kommentar

Festival Gadgets

Schaut doch mal auf meinem neusten Projekt vorbei und entdeckt wieder das Kind in euch! Auf Festival-Gadget.de findet ihr lustige und praktische Gegenstände! Eben die coole Ausrüstung für euer Festival oder Party!


Netzfundstück

Ihr hängt gerne bei Facebook rum und teilt mit euren Freunden fleißig Videos & Bilder?! Dann verdient damit doch etwas Geld! Mit LinkiLike teilt ihr coolen Content und verdient daran sogar noch!


Social Media

Gefällt dir was du liest? Dann unterstütze uns und empfehle Geld-und-Welt.de auf deinen Social Media Plattformen.

  Facebook  Google+  Twitter       RSS

Werbung

  • Skatze: Hi Thomas, vielen Dank für das Lob! Freut mich zu hören, wenn Leute es immer noch informativ find [...]
  • Thomas: Sehr informativ! Beim Thema Kindergeld kommen doch immer wieder Fragem auf. Da ist dieser Artikel do [...]
  • Skatze: Hi Richard, da hast du wohl Recht. Habe es gerade selber nochmal gemerkt, da ich letzte Woche in de [...]
  • Richard: Hoffentlich werde die Preise wirklich sinken! Weil ich finde schon ein Wenig überteuert, besonders [...]
  • Skatze: Das freut mich sehr! :) Dann hoffe ich mal, dass es dir auch weiterhin gefallen wird. Mir macht es [...]

Warning: Parameter 1 to W3_Plugin_TotalCache::ob_callback() expected to be a reference, value given in /homepages/33/d336556176/htdocs/GuW/wp-includes/functions.php on line 3137