Voice-Commerce: Sprechen statt tippen

Die aktuelle Studie „Deutschland, deine Sprachassistenten“ kommt zu einem für viele überraschenden Ergebnis: Digitale Sprachassistenten werden nicht nur verwendet, um Musik abzuspielen, Nachrichten zu hören und Wettervorhersagen abzurufen. Tatsächlich ist es so, dass immer mehr Nutzer per Sprachbefehl einkaufen. Darum ist es an der Zeit, sprachgeführte Assistenten in Onlineshops zu integrieren.
Verbraucher mögen es einfach und komfortabel – und das nicht erst, seitdem sie bequem auf dem Sofa via Smartphone oder Tablet einkaufen und ihre Bankgeschäfte nebenbei erledigen können. Sprachgesteuerte Assistenten wie Alexa, Siri, Cortana oder auch Bixby – um nur die beliebtesten zu nennen – heben den digitalen Komfort auf eine neue Stufe. Mühsames Eintippen einer Suchanfrage in den Browser war gestern, eine Suchanfrage einsprechen ist heute. Dieser Trend wirkt sich natürlich auch auf den E-Commerce aus.
Sprachgeführtes Einkaufen ist auf dem Vormarsch
Mit der Alexa App lässt sich bequem bei Amazon einkaufen, Googles vernetzter Lautsprecher Home ist mit Schnittstellen zu Zalando und Media Markt ausgestattet. Damit könnte Voice-Commerce das Next-Big-Thing sein. Zu einem ganz ähnlichen Ergebnis kommt die Studie „Deutschland, deine Sprachassistenten“ der Dualen Hochschule Baden-Württemberg im Auftrag der Performance-Marketing-Agentur Quisma, für die 1.065 Konsumenten online befragt wurden.1 Zu den zentralen Erkenntnissen der Untersuchung gehört beispielsweise, dass gut 40 Prozent der Nutzer eines Sprachassistenten damit online nach Produkten recherchieren, während mehr als die Hälfte (56 Prozent) persönliche Einkaufslisten via Sprachassistent erstellt. 46 Prozent aller Besitzer kaufen sogar über ihren sprachbasierten Assistenten online ein, überwiegend Produkte des täglichen und mittelfristigen Bedarfs, wie beispielsweise Lebensmittel (39 Prozent).
300 Millionen smarte Lautsprecher bis 2022
Der Hauptgrund für die Nutzung von Sprachassistenten liegt in der Bequemlichkeit der Anwender: Sie wollen nicht mehr selbst tippen müssen (70 Prozent) und stattdessen freihändig kommunizieren (59 Prozent). Zudem können sie per Sprachsteuerung mehrere Dinge gleichzeitig erledigen (49 Prozent). All diese Aspekte deuten darauf hin, dass sprachgeführten Assistenzsystemen eine rosige Zukunft bevorsteht. Derartige Lösungen eignen sich nämlich nicht nur für smarte Speaker wie Google Home oder Amazon Echo, sondern auch für Smart-Home-Szenarien und Chatbots. Prognosen zufolge sollen bis Ende 2018 weltweit rund 100 Millionen vernetzte Lautsprecher im Einsatz sein.2 Damit hätte sich deren Anzahl innerhalb eines Jahres verdoppelt. Bis 2022 soll die Zahl der genutzten Smart-Speaker auf 300 Millionen steigen.3
Voice-Commerce bietet viele Vorteile
In Anbetracht dieser beeindruckenden Zahlen wäre es fahrlässig, wenn Betreiber von Onlineshops nicht auf den Zug aufspringen. Schließlich entfalten sprachgeführte Assistenten ihre Vorteile auch im E-Commerce: Anwender können komplexe Anfragen stellen („Finde ein farblich passendes Shirt mit schmal geschnittener Taille, das sich mit Hose A der Marke B perfekt kombinieren lässt“), das gewünschte Produkt einfach per Sprachbefehl in den Warenkorb legen und kaufen, den Bestellstatus bequem abfragen oder sich auch nach Passformen, Farben und Materialien erkundigen, die zu ihrem individuellen Typ und Stil passen. Darüber hinaus lassen sich Alexa, Siri und Co. auch nutzen, um vorhandene Up- und Cross-Selling-Potenziale auszuschöpfen: Der Sprachassistent kann ganz gezielt jene Produkte empfehlen, die andere Nutzer in Kombination mit einer bestimmten Ware ebenfalls erworben haben.
Die Algorithmen hinter der Anwendung sind entscheidend
Prinzipiell sind die Möglichkeiten des Voice-Commerce nahezu unbegrenzt. Theoretisch lassen sich mit einem sprachgeführten Assistenten genau dieselben Funktionen abbilden, wie man sie aus einem handelsüblichen Onlineshop kennt, über den man mittels Tastatur navigiert. Der tatsächliche Mehrwert beziehungsweise die Leistungsfähigkeit des Shopping-Helfers ist abhängig vom Algorithmus hinter der Anwendung; in der Praxis arbeitet das Verfahren mehrstufig. Hierfür wird das empfangene Audio-Signal zunächst in Phoneme – also in kleinste bedeutungsunterscheidende sprachliche Einheiten – umgewandelt, aus denen dann Wörter und Sätze entstehen. Gegenüber klassischen Verfahren zur automatisierten Spracherkennung (ASR) kommen heute in der Regel Methoden der Künstlichen Intelligenz (KI) zum Einsatz, um die Erkennungsquote zu verbessern. Die Geschäftslogik ermittelt dann den Wunsch des Nutzers und wandelt die eingesprochene Anfrage in klassische, textbasierte Befehle an das Backend um. In einer serviceorientierten Architektur erfolgt das in der Regel durch den Aufruf von Webservices. Das Ergebnis der Anfragen wird dann mittels TTS-Algorithmen (Text-to-Speech) wieder in Sprache umgewandelt und an den Nutzer entsprechend ausgespielt.
Voice-Commerce steht und fällt mit den Produktattributen
Inzwischen gibt es etliche Onlineshops, die erste Voice-Commerce-Funktionalitäten integriert haben, überwiegend in Form von Chats. Sprachgestützte Chatbots helfen dem Verbraucher zum Beispiel dabei, eine Filiale zu finden und sich über deren Öffnungszeiten zu informieren. Dabei handelt es sich zwar um ein nettes Feature, doch Voice-Commerce im eigentlichen Sinne kann viel mehr als das – vorausgesetzt, der Sprachassistent ist an relevante Drittsysteme angebunden: Product-Information-Management-Lösungen (PIM) oder auch Order-Management-Systeme (OMS). Schließlich ist der Assistent nur dann in der Lage, das gesuchte Produkt zu finden, wenn er auf eine entsprechende Datenbasis zurückgreifen kann. Neben einem aktuellen und konsistenten Datenbestand müssen Shopbetreiber darum größtes Augenmerk auf die Produktbeschreibungen legen. Damit ein sprachbasierter Suchbefehl das gewünschte Ergebnis liefert, ist jeder einzelne Produkttext mit Attributen zu versehen, die eine sprachbasierte Suche unterstützen. So empfiehlt es sich im Fashion-Bereich, Referenzen zu anderen Artikeln zu hinterlegen, um Suchanfragen wie „Welche Artikel lassen sich gut kombinieren?“ zielführend beantworten zu können. Anders als bei der Suche per Texteingabe erfolgt naturgemäß keine Autovervollständigung der Suchbegriffe. Das hat zur Folge, dass Shopbetreiber bei der Produktverschlagwortung noch detaillierter und genauer vorgehen müssen als bisher. Denn im Gegensatz zur Textsuche sprechen die Nutzer in kompletten Sätzen, anstatt wie bisher einzelne Stichworte in das Suchfeld einzugeben. Die Folge: Die Anfragen werden einerseits deutlich komplexer, andererseits kann der Anwender sein Anliegen noch klarer vermitteln.
Semantisches Verständnis ist wesentliche Voraussetzung
Um gesprochene Suchanfragen zielführend verarbeiten zu können, braucht es auf technologischer Seite ein entsprechend semantisches Verständnis. In diesem Bereich steckt die Entwicklung allerdings noch in den Kinderschuhen – die Ursache, weshalb die Ergebnisse einer komplexen sprachbasierten Suchanfrage oftmals (noch) nicht die Erwartungen der Nutzer erfüllen. Damit ein Sprachassistent „untrainierte“ Sätze verstehen und ein passendes Ergebnis liefern kann, bedarf es eines komplexen Zusammenspiels von verschiedenen Algorithmen, Dictionaries und Künstlicher Intelligenz. Hier muss die nähere Zukunft zeigen, was möglich ist und umsetzbar sein wird.
Datenschutz ist Trumpf
Neben allen Vorteilen gibt es jedoch auch einige Vorbehalte, die Shopbetreiber ernst nehmen sollten. Laut oben genannter Studie befürchten 38 Prozent der Nichtnutzer und immerhin 22 Prozent jener Konsumenten, die Sprachassistenten anwenden, dass die Sicherheit ihrer personenbezogenen Daten nicht unbedingt gewährleistet ist. Darum will ein Fünftel der Befragten keine persönlichen Daten zur Verfügung stellen – was im E-Commerce natürlich ein Problem ist: denn ohne Angabe von Name und Adresse keine Lieferung. Darum sollten Shopbetreiber für die Entwicklung und Integration eines Sprachassistenten in ihren Onlineshop auf einen Dienstleister zurückgreifen, der höchste Ansprüche in Sachen Datenschutz erfüllt. Er sollte nicht nur dafür sorgen, dass die Server vor unbefugten Zugriffen jederzeit geschützt sind, sondern auch sicherstellen, dass relevante Sicherheitsanforderungen im gesamten Anwendungslebenszyklus Beachtung finden. Hierzu zählen beispielsweise die Richtlinien der OWASP (Open Web Application Security Project) und des BSI (Bundesamt für Sicherheit in der Informationstechnik). Als Non-Profit-Organisation verfolgt die OWASP das Ziel, die Sicherheit von Anwendungen und Diensten im Internet zu verbessern. Das BSI wiederum ist bestrebt, angemessene technische Standards im Aufbau und in der Absicherung von IT-Systemen durchzusetzen. Um ein Maximum an Datensicherheit bei der Anwendungsentwicklung zu gewährleisten, sollten Developer bei der Umsetzung sprachbasierter Assistenten auf theoretische Grundlagen und Empfehlungen zurückgreifen können, etwa in Form von Leitfäden.
Voice-Commerce hat großes Potenzial
Unter der Voraussetzung, dass der Umgang mit personenbezogenen Daten gemäß der Vorgaben von DSGVO und ab voraussichtlich 2019 der ePrivacy-Verordnung rechtssicher erfolgt, sind E-Commerce-Betreiber schon heute gut beraten, ihren Onlineshop zukunftsfähig aufzustellen, indem sie sprachbasierte Assistenten integrieren lassen. Alexa, Siri und Co. erfreuen sich zunehmend großer Beliebtheit, und auch smarte Lautsprecher verbreiten sich in atemberaubender Geschwindigkeit. Da wäre es geradezu töricht, nicht auf den Technologiezug aufzuspringen. Auch wenn Voice-Commerce sehr großes Potenzial hat, steckt der Teufel, wie so oft, im Detail: in den Algorithmen. Damit sich eine Investition tatsächlich auszahlt – nachweislich in steigenden Umsätzen und zufriedenen Kunden – sollten Shopbetreiber die Auswahl des Technologiedienstleisters nicht auf die leichte Schulter nehmen. Innovationsstärke, Erfahrung und natürlich datenschutzrechtliche Aspekte sind die Kriterien, die bei der Entscheidung eine tragende Rolle spielen sollten. Wenn Unternehmen die Chancen gegen etwaige Risiken sorgsam abwägen und den richtigen Dienstleister als Umsetzungspartner wählen, steht einem erfolgreichen Einstieg in den Voice-Commerce nichts im Wege.
Autor

Fr. Dr. Angela Bischoff ist Vice President bei Arvato Systems für Projektgeschäft und Produktentwicklung im E-Commerce. In dieser Funktion ist sie für die DACH-Region und die USA zuständig. Als international agierender IT-Spezialist unterstützt Arvato Systems namhafte Unternehmen bei der Digitalen Transformation. Mehr als 3.000 Mitarbeiter an weltweit über 25 Standorten stehen für hohes technisches Verständnis, Branchen-Know-how und einen klaren Fokus auf Kundenbedürfnisse. Arvato Systems entwickelt innovative IT-Lösungen, bringt seine Kunden in die Cloud, integriert digitale Prozesse und übernimmt den Betrieb sowie die Betreuung von IT-Systemen.
Website: https://it.arvato.com