Wave Net von Deep Mind 13.09.2016, 11:00 Uhr

Googles künstliche Intelligenz spricht wie ein echter Mensch

„Biegen Sie an der nächsten Kreuzung rechts ab“: Die meisten Computerstimmen klingen immer noch unnatürlich. Die Google-Tochter Deep Mind will das mit der Technologie Wave Net ändern. Können Sie die künstliche Intelligenz von einem echten Menschen unterscheiden?

Computer, die sprechen – diverse Plattformen und Programme bieten künstliche Sprachausgabe seit Jahrzehnten an. Ein alter Hut also. Doch seit jeher besteht das Problem, dass Computer nicht natürlich klingen. Das wird immer ärgerlicher, umso mehr Sprachassistenten wie Siri und Google Now Einzug in den Alltag von Millionen Menschen halten. Was also tun, damit Sprachassistenten wie Siri und Google Now in Zukunft noch natürlicher klingen?

Google-Tochter DeepMind entwickelt neue Sprachausgabe

Das britische Unternehmen Deep Mind, spezialisiert auf die Programmierung künstlicher Intelligenzen und mittlerweile Google-Tochter, hat Wave Net entwickelt. Das Sprachprogramm kettet nicht wie andere Sprachcomputer Sprachschnipsel eines Sprechers zu Sätzen zusammen, sondern erzeugt Sprache als eine Wellenform. Dabei fließen auch Daten zu Satzposition, Phonemen, Silben, Wörtern und Sprechern ein.

Top Stellenangebote

Zur Jobbörse
Airbus-Firmenlogo
Program Certification Engineering (d/m/f) Airbus
Manching Zum Job 
Max Bögl Bauservice GmbH & Co. KG-Firmenlogo
Gruppenleiter (m/w/d) Konstruktion Stahlbrücken Max Bögl Bauservice GmbH & Co. KG
Sengenthal Zum Job 
Zweckverband Bodensee-Wasserversorgung-Firmenlogo
Projektmanager (m/w/d) Infrastrukturprojekte Zweckverband Bodensee-Wasserversorgung
Stuttgart Zum Job 
Hamburger Hochbahn AG-Firmenlogo
IT-Systemingenieur*in Leitsysteme Busbetrieb Hamburger Hochbahn AG
Hamburg Zum Job 
Allbau Managementgesellschaft mbH-Firmenlogo
Bauprojektleitung (m/w/d) "Technische Projekte" Allbau Managementgesellschaft mbH
THOST Projektmanagement GmbH-Firmenlogo
Ingenieur*in (m/w/d) im Projektmanagement Bereich Mobilität / Verkehr THOST Projektmanagement GmbH
Nürnberg,Hannover Zum Job 
Berliner Wasserbetriebe-Firmenlogo
Projektleiter:in für große Investitionsprojekte (w/m/d) Berliner Wasserbetriebe
Zweckverband Bodensee-Wasserversorgung-Firmenlogo
Planungskoordinator (m/w/d) im Projekt Zukunftsquelle Zweckverband Bodensee-Wasserversorgung
Stuttgart Zum Job 
Airbus-Firmenlogo
FCAS2023 Flight Simulation Architect (d/f/m) Airbus
Manching Zum Job 
Berliner Wasserbetriebe-Firmenlogo
Leitende:r Ingenieur:in der technischen Betriebsführung / Klärwerk Wansdorf (w/m/d) Berliner Wasserbetriebe
Schönwalde-Glien Zum Job 
Airbus-Firmenlogo
FCAS2023 Flight Simulation Integration Engineer (d/f/m) Airbus
Manching Zum Job 
Cycle GmbH-Firmenlogo
Entwicklungsingenieur für Elektronik (m/f/d) Cycle GmbH
Hamburg Zum Job 
THOST Projektmanagement GmbH-Firmenlogo
Ingenieur*in (m/w/d) im Projektmanagement Bereich verfahrenstechnischer Anlagenbau (Chemie und Pharma) THOST Projektmanagement GmbH
Nürnberg,Hannover,Berlin,Leipzig,Hamburg Zum Job 
Mitscherlich PartmbB-Firmenlogo
Patentingenieur (w/m/d) Fachrichtung Elektrotechnik, Nachrichtentechnik, Maschinenbau oder vergleichbar Mitscherlich PartmbB
München Zum Job 
VTA Verfahrenstechnik und Automatisierung GmbH-Firmenlogo
Ingenieur:in Elektrotechnik (w/m/d) VTA Verfahrenstechnik und Automatisierung GmbH
Gelsenkirchen,Lingen (Ems) Zum Job 
newboxes GmbH-Firmenlogo
Projektingenieur Produktentwicklung (m/w/d) newboxes GmbH
Deutschlandweit Zum Job 
VTA Verfahrenstechnik und Automatisierung GmbH-Firmenlogo
Ingenieur:in Mess-, Steuer- und Regelungstechnik (MSR) (w/m/d) VTA Verfahrenstechnik und Automatisierung GmbH
Gelsenkirchen Zum Job 
VTA Verfahrenstechnik und Automatisierung GmbH-Firmenlogo
Ingenieur:in Automatisierungstechnik (w/m/d) VTA Verfahrenstechnik und Automatisierung GmbH
Gelsenkirchen Zum Job 
Leviat GmbH-Firmenlogo
Bauingenieur (m/w/d) Leviat GmbH
Langenfeld (NRW) Zum Job 
ILF Beratende Ingenieure GmbH-Firmenlogo
Projekt- und technischer Angebotsingenieur (m/w/d) ILF Beratende Ingenieure GmbH
München, Bremen, Hamburg, Essen, Berlin Zum Job 

Wave Net arbeitet mit einem sogenannten Convolutional-neuronal-Network – ein von biologischen Prozessen inspiriertes Konzept des maschinellen Lernens. Das macht es möglich, dass sich gegenseitig beeinflussen und eine natürlich klingende Sprache entsteht, die sich im Laufe der Zeit immer weiter verbessert.

Wave Net erzeugt Sprache als Wellenform. Durch das von biologischen Prozessen inspirierte Konzept des maschinellen Lernens, entsteht eine natürlich klingende Sprache, die sich im Laufe der Zeit immer weiter verbessert. 

Wave Net erzeugt Sprache als Wellenform. Durch das von biologischen Prozessen inspirierte Konzept des maschinellen Lernens, entsteht eine natürlich klingende Sprache, die sich im Laufe der Zeit immer weiter verbessert.

Quelle: Deep Mind

Wave Net hat komplexe Phänomene der natürlichen Sprache besser im Griff – etwa die sogenannte Assimilation. Sie besagt, dass Sprachbausteine – etwa Phoneme, Silben und Satzstücke – in der natürlichen Sprache stets von den Lauten in ihrer Umgebung beeinflusst sind. Sie gleichen sich im Klang an. Der Vokal A etwa klingt direkt vor einem O also anders als vor einem N. Die Kombinationsmöglichkeiten sind gigantisch groß. Entsprechend schwer ist es, diese Phänomene in der künstlichen Sprachausgabe zu berücksichtigen.

Versuchspersonen bestätigen Natürlichkeit der Sprachausgabe

Deep Mind hat Wave Net bereits Tests unterzogen. Probanden sollten sie mit natürlicher Sprache und Beispielsätzen von klassischen Systemen vergleichen und die Natürlichkeit auf einer Skale von 1-5 bewerten. Das Ergebnis: Wave Net landete auf der Bewertungsskala bei 4,21 – die menschliche Sprache bei 4,55. „Wave Net reduziert die Lücke zwischen menschlicher Performance und state-of-the-art um über 50 %“, schreibt Deep Mind im Unternehmens-Blog. Die Methode von Google gehöre zu den besten der Welt.

Und was halten Sie von der neuen Stimme?

Wave Net könnte Sprachassistenten zu einer natürlicheren Stimme verhelfen. Wann der Assistent Google Now davon profitiert, verrät DeepMind allerdings noch nicht. Bis dahin müsste nicht nur die Hardware der Smartphones noch einen Leistungssprung machen. Auch Googles Cloud müsste sich dem erhöhten Rechenaufwand der Methode anpassen.

Doch in Sachen künstlicher Intelligenz macht Google so schnell keiner etwas vor. Erst im März schlug die Nachricht hohe Wellen, dass die Google-Software AlphaGo den Go-Weltmeister Lee Sedol aus Südkorea haushoch geschlagen hat. Das ist nicht irgendein Sieg. Go gilt als schwierigstes Spiel der Welt.

Ein Beitrag von:

  • Patrick Schroeder

    Patrick Schroeder arbeitet als freiberuflicher Journalist für Zeitschriften und Onlinemagazine wie die VDI Nachrichten und Ingenieur.de.

Zu unseren Newslettern anmelden

Das Wichtigste immer im Blick: Mit unseren beiden Newslettern verpassen Sie keine News mehr aus der schönen neuen Technikwelt und erhalten Karrieretipps rund um Jobsuche & Bewerbung. Sie begeistert ein Thema mehr als das andere? Dann wählen Sie einfach Ihren kostenfreien Favoriten.