Smart-Home steuern, Kalender pflegen, Witze erzählen – Alexa kann unfassbar viel, lässt sich wie ein Smartphone mit Apps erweitern und lernt jeden Tag dazu.

Sprachassistenten, die ohne Tastatur, Maus oder Touchscreen verbal Befehle annehmen und umsetzen, gibt es schon lange. Doch erst als Amazon seinen Echo mit der Sprachassistentin Alexa Mitte 2015 in den USA auf den Markt brachte, nahm der Markt so richtig Fahrt auf. Denn auf Anhieb funktionierte Alexa besser als der damalige Platzhirsch Siri, den Apple Ende 2011 mit dem damals neuen iPhone 4s vorstellte. Außerdem kam der Echo gleich mit hervorragenden Mikrofonen und brauchbarem Lautsprecher. Die Kategorie der Smart-Speaker war geboren.

Seit dem hat sich viel getan. Mittlerweile tummeln sich unzählige Smart-Speaker verschiedener Hersteller mit Amazon Alexa, Apples Siri, Googles Assistant oder Microsofts Cortana als Sprachassistenten auf dem Markt. Doch eines ist seit dem ersten Echo konstant: Amazons Alexa ist laut einer Studie von Strategy Analytics Marktführer. Auf Platz Zwei folgt Google Assistant, danach kommt lange nichts.

Das liegt vor allem daran, dass sie ihrer Konkurrenz in den meisten Funktionen einen Schritt voraus ist und die Hardware ein sehr gutes Preis-Leistungs-Verhältnis bietet. Schließlich will Amazon auch nicht mit der Hardware Geld verdienen, sondern möglichst früh so viele Nutzer wie möglich an Alexa binden. Die Monetarisierung folgt später, zum Beispiel über In-App-Käufe. Bisher scheint diese Strategie aufzugehen.

Risiken: Wanze im Wohnzimmer

Bild: Wer auf Nummer sicher gehen will, schaltet das Mikrofon direkt am Gerät aus.

Auf Sprachassistenten im Wohnzimmer gibt es nur zwei mögliche Reaktionen von Verwandten und Besuchern: genial oder furchtbar. Von der Wanze im Wohnzimmer ist gern die Rede, „nie würde ich mir so etwas freiwillig in die Wohnung stellen“, „Die Stasi war eine Lachpille dagegen.“ Und was ist dran?

In der Tat sind die Mikrofone in den Echo-Sprachassistenten immer aktiv, wenn man sie nicht per Knopfdruck auf der Oberseite abschaltet. Schließlich soll das Gerät ja auf ein Keyword reagieren. Es ist aber nicht so, dass alles, was gesprochen wird, permanent bei Amazon landet. Erst, wenn die Hardware des Sprachassistenten das Keyword erkannt hat, zeichnet er auf und überträgt die Stimmen dann in die Cloud. Dort läuft die Auswertung; die Sounddateien werden in Text umgewandelt, und eine künstliche Intelligenz versucht, herauszufinden, was der Nutzer wohl will.

Zwar kommt es immer wieder mal vor, dass Alexa anspringt, obwohl das Keyword nicht genannt wurde. Mal versteht Alexa einfach falsch, oder im Fernsehen oder Radio fällt das Wort Alexa. In diesen Fällen bekommt Amazon mit, was gesprochen wird – aber das ist in der Praxis wohl zu vernachlässigen.

Bei diesen „False Positives“ fallen aber trotzdem Daten an, die Amazon offensichtlich nutzt. Ein Praxisbeispiel: Nachdem der Autor dieses Beitrags eine TV-Sendung mit Joko und Klaas auf Pro Sieben gesehen hat, wurden ihm im Hauptmenü seines Fire-TV-Sticks weitere Inhalte mit den beiden Moderatoren angeboten. Hört Amazon doch mit? Naja: In der Praxis hat ein Werbespot für Alexa die Spracherkennung getriggert. Nach wenigen Sekunden hat der Dienst erkannt, dass der eigene Werbespot hier gerade dudelt und Aufnahme und Erkennung wieder abgebrochen – aber mit diesen Infos weiß Amazon, wann welcher Werbespot gespielt wurde, und was zu dieser Zeit auf diesem Sender lief.

Bild: Der Amazon Echo Show steuert auch Überwachungskameras.

In der Praxis ist es wohl ein deutlich größeres Problem, dass Kinder, Besucher, Podcasts oder Fernsehsendung eine kostenpflichtige Bestellung bei Amazon durchführen. Wer das verhindern möchte, findet die entsprechenden Informationen zum Abschalten der Shopping-Möglichkeiten in seiner Alexa-App. Außerdem könnten unseriöse Skills mehr Daten abgreifen, als ihnen zustehen – aber wer hier wie bei der Installation von Apps auf dem Handy oder von PC-Software mit dem gesunden Menschenverstand herangeht, dürfte sicher sein.

Dazu kommen noch echte Sicherheitsprobleme von Hard- und Software. Es gibt immer wieder Berichte über Dinge, die nicht sein dürfen – bislang waren das aber keine praxisrelevanten Angriffe oder Bugs, sondern Einzelfälle – was einem freilich nichts bringt, wenn man selbst betroffen ist.

Wer zu Paranoia neigt, kann Alexa zuhause aber überwachen oder zähmen. Der größte Teil der („spaßigen“) Attacken – eingespielt in Podcasts, Werbespots & Co. – schießt bereits ins Leere, wenn man das Aktivierungswort ändert, etwa in Echo oder Computer. Netzwerk-Nerds können auch den Datendurchsatz einzelner WLAN-Geräte überwachen und begrenzen. Dann fällt schnell auf, wenn der Echo kommunikativer ist, als man ihm zugesteht. Das ist beispielsweise mit der alternativen Router-Firmware Gargoyle möglich.

Grundfunktionen

Schon direkt ab Werk kann Alexa erstaunlich viel, allerdings kann der Funktionsumfang von Amazon- und Dritthersteller-Geräten variieren. Zum Beispiel erlaubt Amazon nur auf Echo-Geräten das Ändern des Aktivierungskennworts von Alexa auf Amazon, Echo oder Computer. Amazon selbst beschwichtigt dazu auf Nachfrage, dass es in Einzelfällen technische Gründe geben kann, die verhindern, dass Funktionen auf Geräten von Drittanbietern funktionieren. Oder der OEM beschließt, auf bestimmte Funktionen zu verzichten. Das Unternehmen beteuert jedoch, neue Funktionen stets so schnell wie möglich auf Fremdgeräte zu bringen.

Eine der Kernfunktionen von Alexa ist das Abspielen von Musik. Dafür nutzt die Sprachassistentin entweder das hauseigene Amazon Prime Music oder Amazon Music Unlimited. Optional greift Alexa auch auf Spotify für die Wiedergabe von Musik zu. Auch das Setzen eines Timers oder eines Kalendereintrags geht von Haus aus. Sein volles Potenzial entfaltet Alexa aber erst mit dem Einsatz von Skills, die das Äquivalent zu Apps auf Smartphones sind.

Alexa Skills

Bild: Die (Video-)Telefonie von Alexa zu Alexa ist ein Grundfunktion, hierfür wird kein Skill benötigt.

Viele Skills sind bereits vorinstalliert. So kann man Alexa direkt nach dem Auspacken bitten, einen beliebigen Radiosender zu spielen. Für die Wiedergabe greift Alexa auf den Skill TuneIn zu. Auch das Steuern der Philips-Hue-Beleuchtung oder das Abspielen aktueller Nachrichten der Tagesschau kann Alexa von Haus aus.

Das Installieren neuer Skills funktioniert klassisch über die dazugehörige Alexa-App auf dem Smartphone, oder seit einigen Monate direkt per Sprachbefehl. Wer beispielsweise seine täglichen Nachrichten nicht von der Tagesschau, sondern von heise online will, sagt einfach: Alexa, öffne heise online.

Damit der Nutzer aber überhaupt weiß, welche Skills es gibt, lohnt sich der Blick in den Store von Amazon. Denn die Auswahl ist immens. Zur IFA 2018 verriet Amazon-Manager Daniel Rausch, dass es mittlerweile über 50.000 Skills von Drittanbietern gibt. Auch die Kompatibilität ist beeindruckend. Laut Rausch sollen über 20.000 Geräte auf Alexa hören. Auch deswegen gewähren wir dem Bereich Smart-Home mit Alexa steuern in einem zukünftigen Beitrag mehr Raum.

In der folgenden Bilderstrecke haben wir 20 sinnvolle Skills zusammengefasst. Die Betonung liegt auf sinnvoll. Denn sobald man in den Bereich Spaß-Skill abdriftet, hebt das zwar die Stimmung – allerdings gibt es davon unüberschaubar viele. Die Bandbreite reicht von Sparwitzen und Pupsgeneratoren über Quiz- und Reaktionsspiele bis hin zu Horror-Sounds und Katzensimulatoren, um nur ein paar wenige zu nennen. Und über Geschmack lässt sich bekanntlich streiten.

Geräte

Die Smart-Speaker von Amazon sind dank ihres guten Preis-Leistungs-Verhältnisses wohl die beliebtesten Alexa-Geräte am Markt. In der Vergangenheit wurde jedoch häufiger ihr dünner Sound bemängelt. 2018 gönnte Amazon einigen Echo-Geräten ein Hardware-Update und besserte vor allem am Klang nach. Uns haben der Echo Dot 2018 (Testbericht), der Echo Plus 2018 (Testbericht) und der Echo Show 2018 (Testbericht) allesamt sehr gut und deutlich besser als ihre Vorgänger gefallen. Eine hilfreiche Zusammenfassung aktueller Smart-Speaker mit Alexa bietet diese Marktübersicht.

Fazit

Die Anwendungsgebiete Alexas sind riesig. Dabei nimmt Alexa die Position des ersten iPhones ein: Wie damals das iPhone die neue Produktkategorie der Smartphones erschloss, erschließt Alexa die neue Produktkategorie der Smart-Speaker. Parallelen gibt es auch beim Nutzerverhalten. Beim iPhone stellten viele seine Sinnhaftigkeit in Frage, sie wussten nichts mit dem Gerät anzufangen. Auch bei Alexa sind viele davon überzeugt, so etwas nie zu brauchen.

Doch heute haben die meisten iPhone-Zweifler der ersten Stunden selbst ein Smartphone in der Tasche, dessen Entwicklung maßgeblich vom iPhone inspiriert wurde. Vielleicht nimmt Alexa eine ähnliche Pionierrolle ein und ebnet den Weg der Sprachassistenten von der Nische in den Mainstream. Wie das aussehen kann, zeigt der leicht dystopische Film Her mit Joaquin Phoenix und Scarlett Johansson.

