Nutzen und Grenzen eines Sprachassistenten

In einem Digitalisierungsprojekt mit einem Berliner Unternehmen erarbeitete _Gemeinsam digital, wie sich die Verfügbarkeitsabfrage für zwei Seminarräume und deren Reservierung über einen Sprachassistent umsetzen lässt.

Neben diesem Beispiel lässt sich ein Sprachassistent auch auf etliche andere Weisen einsetzen. Dabei gibt es Herausforderungen, die Sie beachten sollten, wenn Sie einen Sprachassistenten einführen möchten.

Der folgende Beitrag hilft Ihnen zu verstehen, wie ein Sprachassistent funktioniert, für welche Bereiche er sinnvoll sein kann und wo die Grenzen dieser Technologie liegen.

Smartphone Sprachassistent

Was ist ein Sprachassistent?

Bei einem digitalen Sprachassistenten handelt es sich um eine Softwarelösung, die gesprochene Wortlaute erkennt und auf Fragen sowie Anweisungen, z.B. das Steuern von vernetzten Geräten, reagiert.

Sprachassistenten gehören inzwischen im privaten Bereich zum Alltag. Am häufigsten verbreitet sind diese in unseren Smartphones, in intelligenten Lautsprechern oder in modernen Autos als zusätzliche Eingabefunktion.

Im Businessbereich sind digitale Sprachassistenten besonders von Nutzen, wenn ein Unternehmen eine Steuerung ohne den Einsatz der Hände benötigt oder wenn es einer Ablenkung der Blickrichtung vorbeugen möchte. Durch einen Sprachassistenten können Unternehmen also Anwendungen in Bereichen zugänglich machen, die sonst mit der Herausforderung der Bedienung zu kämpfen hätten. So ist beispielsweise eine Anwendung auf der Baustelle leichter mit Sprachbefehlen an einen Sprachassistenten zu bedienen, als mit Arbeitshandschuhen. Ebenso lenkt es eine Person, die ein Fahrzeug führt, weniger vom Fahrgeschehen ab, wenn sie eine Anwendung mittels Sprachbefahl statt mit Augen und Fingern bedient.

Zudem kann ein Sprachassistent barrierefrei genutzt werden.

Anwendungsbeispiele im Mittelstand
  • Einsatz im Kundenservice und in der Kundenkommunikation
  • Terminplanung
  • Verfügbarkeitsauskunft und Reservierungsbestätigung
  • Nutzung von digitalen Diensten trotz Einschränkung der Hände durch Handschuhe, Schutzkleidung o.ä.
  • Nutzerfreundliche Bestellannahme wie zur Essenslieferung, Taxiruf, Kartenbestellung für Kino, Theater und Konzerte

Welche Vorteile hat ein Sprachassistent?

Ein Sprachassistent bietet ein paar Benefits, die für manche kleine und mittlere Betriebe interessant sein könnten:

  • Er vergrößert die Nutzungsgruppe durch eine einfache und intuitive Eingabemöglichkeit. Zum Beispiel bei Berufsgruppen, die durch Schutzkleidung in der klassischen Nutzung mit den Händen eingeschränkt sind.
  • Er spart Personalkosten im Kundenservice oder der Bestellannahme ein, denn eine automatisierte Bestellannahme und Weitergabe der Bestellung benötigt ebenso weniger Personal wie auch eine schnelle Beantwortung ständig wiederkehrender Fragen im Kundenservice.
  • Er eröffnet neue Märkte, da er durch einfache und barrierefreie Nutzung über die Spracheingabe vielen Menschen, eine Nutzung des Endgeräts ermöglicht, die das sonst nicht könnten.
  • Sehr geringe laufende Kosten (je nach Funktionsumfang meist unter 100€), da die Nutzung der Sprachassistenten am Markt derzeit kostenfrei ist. Lediglich Zusatzdienste zur Abfrage von Datenbanken, Kalendersystemen oder zur Überführung der Daten in nachgelagerte DMS- oder ECM-Systeme verursachen Kosten.

Welche Herausforderungen kann es geben, wenn Sie einen Sprachassistenten einführen?

  • Die Kosten für die Programmierleistung und Implementierung beginnen für einfache Lösungen im mittleren vierstelligen Bereich. Hierfür wird im Normalfall ein Dienstleister zur Umsetzung der Lösung benötigt. Die Kosten setzen sich aus Programmierleistung der Voice Apps sowie der Anbindung des Datenaustauschs an die Unternehmens-IT zusammen.
  • Kunden müssen vor der Nutzung erst eine Voice App bzw. den Google-Assistant und die entsprechende Google Action installieren. Somit kann der Sprachassistent nur genutzt werden, wenn der Nutzer aktiv wird und die nötige Anwendung installiert, bevor er die entwickelte Voice-App Ihres Unternehmens nutzen kann.
  • Es handelt sich um ein starres System und sämtliche Veränderungen im Ablauf bedürfen einer neuen Programmierleistung. In Bezug auf unser Beispiel mit der Abfrage und Reservierung eines Seminarraums müsste der Sprachassistent neu angepasst werden, falls beispielsweise noch ein dritter Seminarraum hinzukommt, oder falls bei den buchbaren Optionen nun auch ein veganes Catering gebucht werden kann. Sämtliche Änderungen in den optionalen Gesprächsverlauf mit dem Sprachassistent müssen neu angepasst und programmiert werden.

Wie funktioniert ein Sprachassistent und welche Prozesse stecken dahinter?

Ein Sprachassistent funktioniert in einer festen Reihenfolge. Wir haben das hier vereinfacht in fünf Schritten dargestellt:

1. Hören

Sämtliche Tonsignale werden fortlaufend über ein Mikrofon aufgenommen, digitalisiert und klanglich auf Sprachverständlichkeit optimiert.

2. Starten

Dieses optimierte Signal wird kontinuierlich auf ein Schlüsselwort durchsucht. Bekannte Beispiele hierfür sind „Hey Siri“ oder „Alexa“. Sobald dieses erklingt, startet der Übermittlungsprozess in die Cloud des Anbieters zur weiteren Verarbeitung. Die folgenden Punkte 3 und 4 finden dann in der Anbieter-Cloud statt. Der Start dieses Prozesses wird meist mit einem Erkennungston oder einer LED signalisiert.

3. Erkennen

Die automatische Spracherkennung wird von Machine-Learning-Algorithmen durchgeführt. Dieses Verfahren, bei dem Sprache in Text gewandelt wird, nennt sich STT (Speech-to-Text).

Nach der Wandlung in einen Text geht es in einem zweiten Schritt um das Verständnis des Textinhalts. Hierfür wird Natural Language Processing (NLP) eingesetzt.

4. Information einholen

Die benötigten Daten werden aus einem angeschlossenen Datenpool abgerufen. Dies können frei zugängliche Daten aus dem Internet oder spezifische Daten aus einer speziell damit verknüpften Datenbank sein.

5. Helfen

Die ermittelten Daten werden nun entweder direkt auf einem Bildschirm angezeigt oder mithilfe von Text-to-Speech (TTS) Synthesizern als gesprochene Sprache ausgegeben, nachdem sie in umgangssprachlichen Text gewandelt wurden.

Wie läuft die Nutzung eines Sprachassistenten genau ab?

In der folgenden Darstellung zeigen wir vereinfacht, wie die Nutzung eines Sprachassistenten abläuft und wie die Schritte zusammenhängen. Gezeigt wird hier der Ablauf einer Voice-App.

Schema Prozess Sprachassistent

Der Sprachassistent kommuniziert mittels der Voice-App mit dem/der Nutzenden bzw. Kundschaft und verwendet dazu die Informationen und Gesprächsverläufe, die das Unternehmen zur Verfügung gestellt hat. Diese Gesprächsverläufe werden auch Voice Content genannt.

Die aus dem Kundengespräch resultierenden Daten werden dann über einen Dokumenten-Management Dienst in die Cloud-Datenbank des Unternehmens überspielt und parallel dazu als E-Mail an den/die Nutzende oder Kundschaft und das Unternehmen übermittelt. Diese E-Mail dient dem/der Nutzenden als Nachweis und Informationsübermittlung über den angestoßenen Prozess. Dies könnte in unserem Beispiel eine Reservierungsbestätigung inklusive einer Referenznummer sein.

Wie funktioniert ein Voice User Interface (VUI) exemplarisch?

Ein Voice User Interface (VUI) ist eine sprachgesteuerte Benutzerschnittstelle. Sehen Sie zu weiteren Begrifflichkeiten auch in das kurze Technik-Glossar auf dieser Seite.

Im folgenden Beispiel können Sie den modellierten Prozessablauf für die Abfrage und Buchung zweier Seminarräume via Sprachassistenten nachvollziehen.

In der Abbildung sehen Sie die verschiedenen Abfragen (rechteckiger Kasten), Entscheidungspunkte (gelbe Raute) und abhängig von der Nutzerentscheidung den weiteren Ablauf.

Prozessablauf für die Abfrage und Buchung zweier Seminarräume via Sprachassistenten

Die folgende Abbildung zeigt den zu den Abfragen passenden Text, der für den Prozessablauf hinterlegt ist.

Chat-Beispiele des Sprachassistenten

Was sind Voice Apps und Google Actions? Welche Software für einen Sprachassistenten funktioniert auf welchem Endgerät?

Um eigene Funktionen auf ein Endgerät mit Sprachassistent zu bringen, müssen Nutzende sogenannte Voice Apps auf ihrem Gerät installieren, ähnlich wie bei Apps auf dem Smartphone.

Voice Apps sind Programme, mithilfe derer man eigene Dialoge und Funktionalitäten in Sprachassistenten integrieren kann. Wenn man beispielsweise eine Smart-Home-Leuchte via Amazon Smart Speaker steuern möchte, dann muss zuvor die entsprechende Voice App für diese Leuchte installiert werden, ansonsten versteht der Smart-Speaker den Sprachbefehl zum An- oder Ausschalten der Smart-Home-Leuchte nicht.

Bei Google heißt diese Anwendung Google Actions. Auch sie kann auf allen mobilen und smarten Geräten installiert werden.

Der Google Assistant ist eine Software, die es ermöglicht den Google Sprachassistenten auf allen dafür ausgelegten Geräten zu installieren, bei Alexa von Amazon, Siri von Apple und bei Cortana von Microsoft gibt es dagegen nur die Möglichkeit den Sprachassistent auf der eigenen Plattform des jeweiligen Anbieters zu nutzen.

In der folgenden Abbildung können Sie prüfen, welche Software auf welchen Endgeräten nutzbar sind.

Übersicht Anbieter Sprachassistent

In der folgenden Darstellung sehen Sie als Entscheidungshilfe, welcher Sprachassistent die größte Akzeptanz und Reichweite hat.

Diagramm Marktanteile Sprachassistenzsysteme in Deutschland

Fazit für den Einsatz eines Sprachassistenten

Ein Sprachassistent ist eine spannende Technologie, die dem Anwender eine sehr einfache und komfortable Nutzung erlaubt. Immer mehr Menschen nehmen einen Sprachassistenten in Anspruch. Allerdings ist eine Nutzung dieser Technologie für das eigene Unternehmen und die eigenen Dienste komplex in der Einführung und je nach Umfang der Lösung auch entsprechend kostspielig.

Daher sollten Sie genau prüfen, welche Vorteile und Märkte Sie durch einen Sprachassistenten erschließen können. Erstellen Sie als Entscheidungshilfe am besten einen passenden Businessplan.

Wie in vielen Bereichen der Digitalisierung kann man auch in diesem Fall ganz klar sagen, dass eine sinnvolle unternehmerische Nutzung auf den speziellen Fall ankommt und nicht grundsätzlich empfohlen werden kann.

Autor: Anatol Reinke

Redaktion: Marie Landsberg

Auch interessant:

News

Digitalisierungsprojekt mit Stratum abgeschlossen

In unserem gerade abgeschlossenen Projekt mit der Stratum GmbH ging es um die Frage, wie das Unternehmen Kundenanfragen zu Seminarraumbuchungen schneller und einfacher bearbeiten kann.

Kompakt auf einen Blick

Kompakt: Sprach-und Bildererkennung
Technik-Glossar

Automated Speech Recognition (ASR) oder auch Speech-to-Text (SST) genannt: Die Umwandlung gesprochener Sprache in Textform.
Dialog Manager (DM) veranlasst die Entscheidung und Durchführung notwendiger Schritte zur Beantwortung der Anfrage.
Natural Language Processing (NLP) ermöglicht die Zuordnung einer Bedeutung zum erkannten Text und codiert diesen in strukturierte Informationen.
Text-to-Speech (TTS) übernimmt die aus einem Text generierte Sprachausgabe. Dazu wird der analysierte Text in kleinste sinngebende Spracheinheiten, sogenannte Phoneme, zerlegt und aus vor aufgenommenen Einheiten zu gesprochenen Wörtern und Sätzen neu zusammengesetzt.
Voice User Interface (VUI) Sprachgesteuerte Benutzerschnittstelle

Kontaktieren Sie uns.

Bei Fragen und Anmerkungen helfen wir Ihnen gerne weiter. Schreiben Sie uns!

Nicht lesbar? Neues Captcha anfragen. captcha txt

Start typing and press Enter to search