Sprachassistenten

Siri vs. Cortana vs. Google Now: Das Duell

16.12.2015 von Michael Rupp

Siri von Apple, Cortana in Windows 10 und Google Now streiten um den Job als Ihr persönliche Sprachassistent. Wir machen den Vergleichstest.

ca. 2:40 Min
Vergleich
VG Wort Pixel
  1. Siri vs. Cortana vs. Google Now: Das Duell
  2. Cortana im Test
  3. Google Now im Test
  4. Siri im Test
Sprachassistenten Siri, Now und Cortana
Sprachassistenten wie Google Now, Cortana und Siri wollen nicht einfach nur Befehle deuten, sondern den Nutzer verstehen.
© Hersteller

Die richtigen Informationen genau zur richtigen Zeit ? das versprechen Apple, Google und Microsoft mit ihren smarten Assistenzdiensten. Einmal ausprobiert, nie genutzt: So geht es vielen Nutzern nach dem ersten Kontakt mit Apple Siri, Google Now und Microsoft Cortana. Dabei hat es schon etwas Mystisches, wenn auf dem Smartphone kurz vor Feierabend und ohne aktives Zutun zum ersten Mal die geschätzte Fahrzeit nach Hause erscheint ? minutengenau vorhergesagt unter Berücksichtigung der aktuellen Verkehrslage auf den relevanten Straßen.

Was die Assistenten wirklich leisten

Im Vergleichstest mussten die Assistenzsysteme ihre Alltagstauglichkeit unter Beweis stellen. Auch wenn sich die grundlegenden Funktionen ähneln, gibt es große Unterschiede beim Umfang und bei der Darstellung kontextabhängiger und anwenderspezifischer Informationen, der Umsetzung von Befehlen und Suchanfragen sowie der Ansprache des Nutzers. Keines der Systeme funktioniert perfekt. Immer wieder frustrieren gerade einfache Aufgaben, die nicht erfolgreich durchgeführt werden.

Lesetipp: Mehr Vergleichstests auf pc-magazin.de

Mal entpuppt sich beim Aufsprechen einer Mail die Auswahl der Empfängeradresse als kaum überwindbares Hindernis, weil zu einem Kontakt zwei ähnlich klingende Adressen hinterlegt sind (Cortana). Oder es werden Namen wie Nils als Niels erkannt, es sei denn, man spricht übertrieben Nillllls (Siri). Now wertet schon minimale Pausen beim Sprechen als Kommandoende, obwohl man noch gar nicht fertig war. Was ein Gin Tonic ist, erläutert Now einwandfrei per Sprachausgabe, die Frage ?Wo kann ich Gin kaufen?? dagegen nur Siri. Cortana brachte bei der Frage nach Gin Tonic immerhin den Wikipedia-Treffer zur Anzeige, wollte danach bei ?Wo kann ich Gin kaufen?? das Wort Gin aber partout nicht mehr verstehen ? nach 35 Versuchen mit drei Sprechern gaben wir schließlich auf.

Sprechen ist besser als tippen

Vor allem unterwegs sind die Assistenten nützlich, wenn man keine Möglichkeit zum Tippen hat oder sich neue Mails beim Autofahren vorlesen lässt. Sie hören dem Nutzer auf Zuruf zu und antworten in natürlicher, durchweg gut verständlicher Sprache. Alle Assistenten lassen sich auch ohne Mikrofon steuern, allerdings muss man die Befehle dann umständlich über die (Bildschirm-) Tastatur eintippen. Bequemer ist natürlich die Handsfree-Befehlseingabe auf Zuruf über ein einleitendes ?Hey Cortana?, ?OK Google? oder ?Hey Siri2. Dafür lauschen die Assistenten ständig am Mikrofon.

Wann die Assistenten helfen

Das Funktionsrepertoire der Assistenten deckt grob die Bereiche Organisation und Kommunikation (Kalender, Erinnerungen, Mails, Kurznachrichten und Wecker), Interaktion (Navigation, App-Aufrufe und Musikwiedergabe), Suchen (in der Nähe, auf dem Gerät und Web) sowie Textdiktate ab. Google Now, Cortana und seit dem letzten Update auch Siri verstehen sich auf proaktive Aktionen. Mit Personen, Orten, Apps oder Situationen verknüpfte Informationen oder Aktivitäten werden vorausschauend angezeigt, vorgeschlagen oder ausgeführt. Dabei merkt sich der jeweilige Assistent die Gewohnheiten seines Nutzers und wertet im Kontext greifbare Daten aus, angefangen von Terminen, Kontakten und Standortangaben bis hin zu früheren Abfragen, installierten Apps und den gerade am Display angezeigten Informationen. So entsteht der Eindruck eines ?mitdenkenden? Assistenten.

Lesetipp: Jahresrückblick 2015 - IT und Technik

Die dafür nötigen Datenbanken, KI-Netzwerke und Parser, die Spracheingaben des Nutzers in Aktionen umsetzen, liegen generell auf den Servern der Anbieter. Vom PC, Smartphone, Tablet und der Smartwatch übermittelt wird nach dem Client-Server-Prinzip nur der digitalisierte Sprachmitschnitt. Zurück kommen Anweisungssequenzen, die dann lokal ausgeführt werden. Dadurch lassen sich serverseitig nach und nach Assistenzfunktionen verbessern oder neue Features integrieren.

Mehr lesen

Chronologische Liste und Netflix-Links

Marvel-Filme- und -Serien: Das ist die richtige Reihenfolge

Neuerscheinungen in der Übersicht

Netflix: Neue Filme und Serien

Vorschau auf Film- und Serien-Highlights

Amazon Prime Video: Neuheiten

Weiter zur Startseite  

Mehr zum Thema

Kodak-Patente verkauft

Wirtschaft

Kodak bestätigt Verkauf von Patenten

Kodak bestätigt den erwarteten Verkauf seiner Imaging-Patente und -Lizenzen an ein Konsortium rund um Google, Apple und Microsoft für rund 525…

Microsoft Surface Windows 8 Pro

Windows, Android & iOS

So finden Sie das richtige Tablet

Apples iPad, Android oder doch lieber ein Windows-Tablet? Wir zeigen, welche Geräte gut sind, wenn Sie diese zu Hause, unterwegs oder zum Arbeiten…

Tablet, Trio,

Tablet-Trio im Vergleich

iPad Air 2, Galaxy Tab 10.5 und Lenovo Thinkpad 10 im Test

Wir machen den Vergleich: Das iPad Air 2, das Samsung Galaxy Tab 10.5 und das Lenovo Thinkpad 10 stellen sich im Test.

iPad Pro vs Surface Pro 4

Hybrid-Tablets

iPad Pro vs. Surface Pro 4: Praxis-Duell der Power-Tablets

Das Apple iPad Pro und das Microsoft Surface Pro 4 sind gute Tablets für Studium, Beruf und mehr. Wir verraten, welches Gerät sich für wen eignet.

Amazon Echo in Deutschland

Intelligente Sprachassistenten

Siri, Cortana, Alexa und Google Assistant im Vergleich

Mittlerweile gibt es immer mehr intelligente Sprachassistenten, die nicht nur Befehle verfolgen, sondern auch dazu lernen sollen. Was können Sie…