Software 13.09.2002, 18:21 Uhr

Plausch mit Computern – auch auf platt

In Zukunft werden immer mehr Computer und Maschinen von Stimmen gesteuert. „Jede elektronische Funktionalität kann auf Sprache umgestellt werden“, ist Christoph Pfeiffer, Vorsitzender des Branchenverbandes für Voice Commerce, VASCom, überzeugt. Im Interview zeigt er Perspektiven auf.

VDI nachrichten: Herr Pfeiffer, was ist eigentlich Voice Commerce?
Pfeiffer: Unter Voice Commerce verstehen wir das Abrufen von Informationen und das Durchführen von Transaktionen per Sprache. Man unterscheidet zwischen Diktier- und Dialogsystemen. Erstere sind sprecherabhängig. Sie werden an die Sprachgewohnheiten eines bestimmten Nutzers angepasst. Die Worterkennung ist zwar entsprechend gut, das mögliche Einsatzgebiet aber klein. Dialogsysteme hingegen sind offen, können also von Jedermann genutzt werden.
VDI nachrichten: Welche Einsatzgebiete gibt es für Dialogsysteme?
Pfeiffer: Über Informationsportale können etwa das Kinoprogramm oder Börsen- und Wetterdaten eingeholt werden. Der Anrufer kann also fragen: Wie war der Schlusskurs der BMW-Aktie am letzten Donnerstag? Banken nutzen Voice-Systeme, um Ihre Kunden über Kontostände zu informieren. Der fortschrittliche Versandhandel ermöglicht gar Bestellungen via Sprachcomputer. Auch in die klassische Industrie hält die Stimme Einzug, vor allem im Automobilbau. So bieten moderne Fahrzeuge sprachgesteuerte Navigationssysteme und führen den Fahrer zur nächstgelegenen Tankstelle.
VDI nachrichten: Welche Anwendungen sind in der Pipeline?
Pfeiffer: Aktuell wird beispielsweise an Sprachdialogsystemen gearbeitet, die bei der Kommissionierung von Waren im Lager helfen. Noch werden einzelne Bestellungen per Laufzettel zusammengestellt. Entnahmen werden mit Hilfe von Barcode-Lesern registriert. Die Zukunft sieht anders aus: Der Mitarbeiter gibt dem System via Headset den Auftrag, die nächste Order aufzurufen. Als Antwort bekommt er den für die Warenzusammenstellung optimalen Weg. Jeden entnommenen Posten meldet er dem System, welches die Abgänge direkt verbucht.
VDI nachrichten: Plauschen wir also demnächst mit Kollege Computer?
Pfeiffer: Nicht in den nächsten Jahren. Noch liegt die Zahl der vom Dialogsystem erkannten Wörter bei etwa 20 000. Das liegt zum einen an der Vielzahl möglicher Sprecher. Das hat aber auch technische Hintergründe. Öffentliche Dialogsysteme müssen auch per Handy erreichbar sein. Die im Mobilfunk eingesetzten niedrigen Hertz-Zahlen erlauben nur eine schwache Laut-Differenzierung. Ist ein größerer Wortschatz nötig, müssen Untergruppen gebildet werden. Sollen beispielsweise alle Aktienkurse weltweit abrufbar sein, muss eine Unterscheidung des Börsenplatzes vorgeschaltet werden, etwa Frankfurt oder New York. Jeder mögliche Wert braucht schließlich mehrere Synonyme. So muss für „BMW“ auch „Bayrische Motorenwerke“ oder die englische Aussprache des Begriffs reserviert sein.
VDI nachrichten: Wie wird die Wahrnehmung des Systems verbessert?
Pfeiffer: Immer wichtiger wird die Semantik. Systeme werden also daraufhin trainiert, die Satzbedeutung zu verstehen. So können einzelne Wörter aus dem Zusammenhang identifiziert werden. Außerdem wächst die Bedeutung der Prosodie, also der Gewinnung von Informationen aus Tonlage und Melodie. Fortschrittliche Systeme verbinden genervte Anrufer schnell an einen freien Sachbearbeiter.
VDI nachrichten: Was ist mit Dialekten, etwa plattdeutsch? Können Systeme damit umgehen?
Pfeiffer: Dialekte sind der Worterkennung teilweise sogar dienlich, weil sie zu Übertreibungen in der Aussprache führen und dadurch das Muster eines Wortes klarer wiedergeben. Wenn sie aber fremdsprachenartig werden, scheitert die Erkennung. Hingegen sind Antworten in Dialekten oder Fremdsprachen möglich. Multilinguale Systeme passen sich bei jeder Frage der Sprache des Anwenders an – wenn es sein muss auch plattdeutsch.
VDI nachrichten: Wird das sprachbasierte Internet je Wirklichkeit?
Pfeiffer: Es gibt bereits das Voice Web. Die Inhalte sind aber im Vergleich zum World Wide Web reduziert. Bemühungen, das Internet eins zu eins auslesen zu lassen, sind weitgehend eingestellt worden. Zwar können Text-to-Speech-Engines alles vertonen, der Mehrwert ist aber gering. Das System würde Bildunterschriften oder Randbemerkungen genauso wiedergeben wie den Haupttext. Ohne grafische Unterstützung erreicht den Hörer dann nur Kauderwelsch.
VDI nachrichten: Was ist Ihre Vision für den Voice Commerce?
Pfeiffer: Verschiedene Geräte sollen nebeneinander und absolut gleichwertig dem In- und Output dienen. Ein Beispiel: Wenn ich ein Ticket für einen Flug nach Frankfurt suche, dann möchte ich nach einem Anruf verschiedene Angebote auf meinem PDA (Personal Digital Assistant) sehen und das beste mit dem Stift auswählen können. Via Handy sollte sich das System dann bedanken und nach einem Rückflug fragen. Die dafür geltenden Konditionen möchte ich mir an den Zielort faxen lassen können. Diese Konvergenz in den Endgeräten muss mit der Konvergenz der Dienste einhergehen. Dazu benötigen wir einheitliche Standards. VoiceXML 2.0 ist da auf dem richtigen Weg. Im Gegensatz zum Konkurrenzstandard SALT (Speech Application Language Text) lehnt er sich am verbreiteten XML-Standard an. Entsprechend groß ist die User-Community, die auch einschlägige Applikationen schreiben kann.
S. ASCHE

Von S. Asche
Von S. Asche

Stellenangebote im Bereich Softwareentwicklung

Pixida-Firmenlogo
Pixida Functional Owner – Digital Services und Connected Devices (m/w/d) München
Porsche AG-Firmenlogo
Porsche AG Softwareingenieur (m/w/d) ASPICE für Entwicklungsprozesse Weissach
Jungheinrich Aktiengesellschaft-Firmenlogo
Jungheinrich Aktiengesellschaft Embedded Softwareentwickler (m/w/d) Norderstedt
Porsche AG-Firmenlogo
Porsche AG IT Security Expert (m/w/d) Digital Workplace Weilimdorf
XTRONIC GmbH-Firmenlogo
XTRONIC GmbH Embedded Software Developer (w/m/d) Böblingen
DIgSILENT GmbH-Firmenlogo
DIgSILENT GmbH Ingenieur Elektrotechnik (w/m/d) Anwendungsentwickler C++ Gomaringen
Porsche AG-Firmenlogo
Porsche AG Service-Experte (w/m/d) Data-Streaming Weilimdorf
XTRONIC GmbH-Firmenlogo
XTRONIC GmbH Requirements Engineer Bereich Kombiinstrumente (m/w/d) Böblingen
A. Eberle GmbH & Co. KG-Firmenlogo
A. Eberle GmbH & Co. KG Techniker / Ingenieur im Bereich Power Quality (m/w/d) Nürnberg
DMK Deutsches Milchkontor GmbH-Firmenlogo
DMK Deutsches Milchkontor GmbH PLC Software Engineer (m/w/d) Anlagentechnik Lebensmittelproduktion Georgsmarienhütte

Alle Softwareentwicklung Jobs

Top 5 IT & T…

Zu unseren Newslettern anmelden

Das Wichtigste immer im Blick: Mit unseren beiden Newslettern verpassen Sie keine News mehr aus der schönen neuen Technikwelt und erhalten Karrieretipps rund um Jobsuche & Bewerbung. Sie begeistert ein Thema mehr als das andere? Dann wählen Sie einfach Ihren kostenfreien Favoriten.