Wave Net von Deep Mind 13.09.2016, 11:00 Uhr

Googles künstliche Intelligenz spricht wie ein echter Mensch

„Biegen Sie an der nächsten Kreuzung rechts ab“: Die meisten Computerstimmen klingen immer noch unnatürlich. Die Google-Tochter Deep Mind will das mit der Technologie Wave Net ändern. Können Sie die künstliche Intelligenz von einem echten Menschen unterscheiden?

Computer, die sprechen – diverse Plattformen und Programme bieten künstliche Sprachausgabe seit Jahrzehnten an. Ein alter Hut also. Doch seit jeher besteht das Problem, dass Computer nicht natürlich klingen. Das wird immer ärgerlicher, umso mehr Sprachassistenten wie Siri und Google Now Einzug in den Alltag von Millionen Menschen halten. Was also tun, damit Sprachassistenten wie Siri und Google Now in Zukunft noch natürlicher klingen?

Google-Tochter DeepMind entwickelt neue Sprachausgabe

Das britische Unternehmen Deep Mind, spezialisiert auf die Programmierung künstlicher Intelligenzen und mittlerweile Google-Tochter, hat Wave Net entwickelt. Das Sprachprogramm kettet nicht wie andere Sprachcomputer Sprachschnipsel eines Sprechers zu Sätzen zusammen, sondern erzeugt Sprache als eine Wellenform. Dabei fließen auch Daten zu Satzposition, Phonemen, Silben, Wörtern und Sprechern ein.

Top Stellenangebote

Zur Jobbörse
Brandenburgischer Landesbetrieb für Liegenschaften und Bauen-Firmenlogo
Ingenieur/innen für Tiefbau (m/w/d) im Baubereich Bundesbau Brandenburgischer Landesbetrieb für Liegenschaften und Bauen
Brandenburgischer Landesbetrieb für Liegenschaften und Bauen-Firmenlogo
Sachbearbeiter/in für Elektrotechnik (m/w/d) im Geschäftsbereich Baumanagement Bund Brandenburgischer Landesbetrieb für Liegenschaften und Bauen
Frankfurt (Oder) Zum Job 
Brandenburgischer Landesbetrieb für Liegenschaften und Bauen-Firmenlogo
Technische/r Sachbearbeiter/in für Tiefbau (m/w/d) im Baubereich Bund Brandenburgischer Landesbetrieb für Liegenschaften und Bauen
Potsdam Zum Job 
THD - Technische Hochschule Deggendorf-Firmenlogo
Professor/Professorin (m/w/d) für das Lehrgebiet "Nachhaltige Baukonstruktion und Produktmanagement" THD - Technische Hochschule Deggendorf
Pfarrkirchen Zum Job 
Frankfurt University of Applied Sciences-Firmenlogo
Professur (W2) Mathematik in den Ingenieurwissenschaften Frankfurt University of Applied Sciences
Frankfurt am Main Zum Job 
Stadtwerke Lübeck Gruppe-Firmenlogo
Projektleiter:in Digitalisierung der Netze Stadtwerke Lübeck Gruppe
Lübeck Zum Job 
Landesregierung Brandenburg-Firmenlogo
Architekten/in (m/w/d) Hochbau oder Bauingenieur/in (m/w/d) Hochbau für den Landesbau Landesregierung Brandenburg
Frankfurt (Oder) Zum Job 
Bundesagentur für Arbeit-Firmenlogo
Technische/-r Berater/-in (w/m/d) Bundesagentur für Arbeit
Münster, Rheine, Coesfeld Zum Job 
Bundesamt für Kartographie und Geodäsie-Firmenlogo
Vermessungsingenieur/in (m/w/d) Dipl.-Ing. FH/Bachelor Bundesamt für Kartographie und Geodäsie
Frankfurt am Main Zum Job 
Landesregierung Brandenburg-Firmenlogo
Fachingenieur/in (w/m/d) für Gebäude-, Energie- und Versorgungstechnik Landesregierung Brandenburg
Cottbus, Potsdam Zum Job 
FH Münster-Firmenlogo
Mitarbeiter/in (w/m/d) zur Koordination der Schulkontakte FH Münster
Steinfurt Zum Job 
über ifp l Personalberatung Managementdiagnostik-Firmenlogo
Stellvertretende Leitung Bau- und Gebäudetechnik (m/w/d) über ifp l Personalberatung Managementdiagnostik
Rhein-Main-Gebiet Zum Job 
Die Autobahn GmbH des Bundes-Firmenlogo
Bauingenieur (w/m/d) Brückenprüfung Die Autobahn GmbH des Bundes
TAUW GmbH-Firmenlogo
Projektingenieur:in (m/w/d) Hydro(geo)logische Modellierungen TAUW GmbH
verschiedene Standorte Zum Job 
PNE AG-Firmenlogo
Experte Technischer Einkauf für Windenergieanlagen (m/w/d) PNE AG
Hamburg, Husum, Cuxhaven Zum Job 
Stadtwerke München GmbH-Firmenlogo
Instandhaltungsmanager*in (m/w/d) Stadtwerke München GmbH
München Zum Job 
Rittal GmbH & Co. KG-Firmenlogo
Maschinenbauingenieur / Prüfingenieur (m/w/d) Dynamik / Schwingungstechnik Rittal GmbH & Co. KG
Herborn Zum Job 
Fraunhofer-Institut für Angewandte Festkörperphysik IAF-Firmenlogo
Wissenschaftler (m/w/d) - angewandte NV-Magnetometrie und Laserschwellen-Magnetometer Fraunhofer-Institut für Angewandte Festkörperphysik IAF
Freiburg im Breisgau Zum Job 
Deutsche Rentenversicherung Bund-Firmenlogo
Teamleiter*in Bauprojekte Elektrotechnik (m/w/div) Deutsche Rentenversicherung Bund
Stadtwerke Frankenthal GmbH-Firmenlogo
Energieberater (m/w/d) Stadtwerke Frankenthal GmbH
Frankenthal Zum Job 

Wave Net arbeitet mit einem sogenannten Convolutional-neuronal-Network – ein von biologischen Prozessen inspiriertes Konzept des maschinellen Lernens. Das macht es möglich, dass sich gegenseitig beeinflussen und eine natürlich klingende Sprache entsteht, die sich im Laufe der Zeit immer weiter verbessert.

Wave Net erzeugt Sprache als Wellenform. Durch das von biologischen Prozessen inspirierte Konzept des maschinellen Lernens, entsteht eine natürlich klingende Sprache, die sich im Laufe der Zeit immer weiter verbessert. 

Wave Net erzeugt Sprache als Wellenform. Durch das von biologischen Prozessen inspirierte Konzept des maschinellen Lernens, entsteht eine natürlich klingende Sprache, die sich im Laufe der Zeit immer weiter verbessert.

Quelle: Deep Mind

Wave Net hat komplexe Phänomene der natürlichen Sprache besser im Griff – etwa die sogenannte Assimilation. Sie besagt, dass Sprachbausteine – etwa Phoneme, Silben und Satzstücke – in der natürlichen Sprache stets von den Lauten in ihrer Umgebung beeinflusst sind. Sie gleichen sich im Klang an. Der Vokal A etwa klingt direkt vor einem O also anders als vor einem N. Die Kombinationsmöglichkeiten sind gigantisch groß. Entsprechend schwer ist es, diese Phänomene in der künstlichen Sprachausgabe zu berücksichtigen.

Versuchspersonen bestätigen Natürlichkeit der Sprachausgabe

Deep Mind hat Wave Net bereits Tests unterzogen. Probanden sollten sie mit natürlicher Sprache und Beispielsätzen von klassischen Systemen vergleichen und die Natürlichkeit auf einer Skale von 1-5 bewerten. Das Ergebnis: Wave Net landete auf der Bewertungsskala bei 4,21 – die menschliche Sprache bei 4,55. „Wave Net reduziert die Lücke zwischen menschlicher Performance und state-of-the-art um über 50 %“, schreibt Deep Mind im Unternehmens-Blog. Die Methode von Google gehöre zu den besten der Welt.

Und was halten Sie von der neuen Stimme?

Wave Net könnte Sprachassistenten zu einer natürlicheren Stimme verhelfen. Wann der Assistent Google Now davon profitiert, verrät DeepMind allerdings noch nicht. Bis dahin müsste nicht nur die Hardware der Smartphones noch einen Leistungssprung machen. Auch Googles Cloud müsste sich dem erhöhten Rechenaufwand der Methode anpassen.

Doch in Sachen künstlicher Intelligenz macht Google so schnell keiner etwas vor. Erst im März schlug die Nachricht hohe Wellen, dass die Google-Software AlphaGo den Go-Weltmeister Lee Sedol aus Südkorea haushoch geschlagen hat. Das ist nicht irgendein Sieg. Go gilt als schwierigstes Spiel der Welt.

Ein Beitrag von:

  • Patrick Schroeder

    Patrick Schroeder arbeitete während seines Studiums der Kommunikationsforschung bei verschiedenen Tageszeitungen. 2012 machte er sich als Journalist selbstständig. Zu seinen Themen gehören Automatisierungstechnik, IT und Industrie 4.0.

Zu unseren Newslettern anmelden

Das Wichtigste immer im Blick: Mit unseren beiden Newslettern verpassen Sie keine News mehr aus der schönen neuen Technikwelt und erhalten Karrieretipps rund um Jobsuche & Bewerbung. Sie begeistert ein Thema mehr als das andere? Dann wählen Sie einfach Ihren kostenfreien Favoriten.