Eine Einführung in Intelligente Persönliche Assistenten

By Published On: März 20th, 2018Categories: sprachassistenten & voice

Innovationen bestimmen unser digitales Dasein. Besonders in den letzten Jahren kamen immer mehr innovative Technologien auf, die unseren beruflichen und privaten Alltag erleichtern sollten.

Eine wichtige Errungenschaft stellen die sogenannten intelligenten persönlichen Assistenten dar. Sie sind mittlerweile ein kaum wegzudenkender Teil der allgegenwärtigen Digitalisierung.

So lassen sich diese virtuellen Assistenten in sämtlichen Gadgets wie Smartphones, Tablets und auch Smart Watches finden. Der immer stärker werdende Wettbewerb in diesem Bereich hat zu vielen Verbesserungen geführt. Große Anbieter, allen voran Amazon, Google, Microsoft und Apple, bieten eine gesamte digitale Infrastruktur, die mit Hilfe von Sprachassistenz gesteuert werden kann.

 

Downloade unseren ultimativen, gratis Chatbot-Leitfaden für dein Unternehmen. 

 

Wie funktioniert ein intelligenter persönlicher Assistent?

Ein virtueller Assistent ist eine Technologie, die auf künstlicher Intelligenz basiert.

Die entsprechende Software verwendet das Mikrofon eines Geräts, um sprachliche Benutzeranfragen zu empfangen, während am Lautsprecher eine Sprachausgabe erfolgt. Das Spannende passiert zwischen diesen beiden Aktionen. Es ist eine Kombination aus mehreren verschiedenen Technologien, insbesondere aus Spracherkennung, -analyse und -verarbeitung.

Wenn man als Benutzer einen persönlichen Assistenten zur Durchführung einer Aufgabe auffordert, wird das Audiosignal der natürlichen Sprache in digitale Daten umgewandelt, die von der Software analysiert werden können.

Diese Daten werden dann anhand eines innovativen Algorithmus mit einer Datenbank der Software verglichen, um eine passende Antwort zu finden.

Diese Datenbank befindet sich auf verteilten Servern in Cloud-Netzwerken. Aus diesem Grund können die meisten KI-Assistenten nicht ohne eine zuverlässige Internetverbindung auskommen. Die Datenbank der Software wird mit zunehmender Anzahl von Anfragen erweitert und optimiert. Dies verbessert zum einen die Spracherkennung und erhöht zum anderen die Reaktionsgeschwindigkeit des Systems.

 

Smart Speaker: die Erweiterung der intelligenten Assistenz

Der entscheidende Schritt auf dem Gebiet der Entwicklung einer gesamten Infrastruktur für virtuelle Assistenz gelang Amazon im Jahr 2014. Das Unternehmen brachte mit Echo den ersten Smart Speaker auf den Markt. Google und Microsoft kamen erst danach und schufen mit Google Home und Harman Kardon zwei weitere intelligente Lautsprecher. Apple stieg mit Apple Homepod als letzter erst im Jahr 2018 ins Rennen.

Die Smart Speaker sind stylische Objekte, die in der häuslichen Umgebung zum Einsatz kommen und die Funktionalität eines Musiklautsprechers und eines intelligenten Assistenten vereinen. Ausgestattet mit einem innovativen Spracherkennungssystem sind sie in der Lage, die Stimme des Benutzers aus einer Entfernung von mehr als 5 Metern wahrzunehmen.

Solche Smart Speaker unterscheiden sich deshalb von anderen üblichen Gadgets, bei denen es sich ausschließlich um persönliche Gegenstände handelt, die ständig mitgenommen werden müssen. Smart Speaker wurden als stationäre Entertainment-Objekte für die ganze Familie konzipiert, und alle Familienmitglieder können sie nutzen.

Es ist wohl wenig überraschend, dass die Software für Spracherkennung, die dem jeweiligen Smart Speaker zugrunde liegt, sich am besten in ihrem eigenen digitalen Ökosystem wohl fühlt. So funktioniert Google Assistant am besten mit Google Apps, Chromecast, Google Home und anderen Google-Geräten. Und Alexa, die Sprachsoftware von Amazon bringt ihre beste Leistung an Amazon Fire Tablets, Fire Sticks und Echo-Geräten.

Cortana, die Software von Microsoft, ist hier eine Ausnahme. Denn Microsoft will sich mit seinem Produkt vor allem als führender Anbieter im Bereich der virtuellen Assistenz für Unternehmen etablieren. Cortana wird deswegen eher für Businessanwendungen von Microsoft wie Office oder Dynamics optimiert, sowie für die LinkedIn Plattform. Außerdem gelang es dem amerikanischen Softwareriesen zwei Automobilhersteller zu überzeugen. Fahrzeuge von Nissan und Volkswagen werden mit der Cortana Spracherkennungssoftware ausgestattet.

 

Die Besonderheiten der Spracherkennungssoftware

Das Konzept aller Spracherkennungssysteme ist ähnlich, doch trotzdem hat jedes dieser Systeme seine Besonderheiten.

So gelingt es Google Assistant besonders gut den Kontext des Gesagten zu verstehen. Hier profitiert das System von der gigantischen Datenbank der Sucheinträge. Denn bei anderen Assistenten müssen Sie den Befehl ziemlich genau übermitteln, damit die gewünschte Aufgabe richtig erledigt wird.

Google kann dagegen mit großer Wahrscheinlichkeit herausfinden, was dir am Herzen liegt, wenn du es auf unterschiedliche Weisen kundtust. Außerdem wird man sich relativ bald auch mehrsprachig mit dem Sprachassistenten verständigen können. Seit einiger Zeit enthält das System auch sogenannte Routinen. Das sind Sprachbefehle, die eine Kette von Aktionen mit sich bringen können. Der Benutzer selbst programmiert die Reihenfolge oder Zusammensetzung der Befehle.

 

Alexa von Amazon

Amazon bietet die wohl beste Anpassungsfähigkeit von allen Assistenten.

Das System kann mit einem der 15 000 Skills erweitert werden. Skills sind spezielle Erweiterungen, die besondere Funktionalität bieten. So gibt es hier beispielsweise viele Übersetzer der gängigen Sprachen, Assistenten für Fernsehprogramme, aber auch Nachrichten- oder Wetter-Skills.

Großer Beliebtheit erfreuen sich Skills, die Audiobücher von Amazon Kindle vorlesen. So ermöglicht Alexa auch eine optimale Zusammenarbeit aller kompatiblen Geräte sowie eine automatische Erkennung der Stimmen. Somit kann man auch von Alexa individuelle Vorschläge erhalten.

 

Siri von Apple

Auch Siri hat ihre Stärken, insbesondere wenn es um die Vernetzung und Zusammenarbeit von Apples zahlreichen Geräten geht.

Dabei funktioniert die Spracherkennung sowohl auf älteren Gadgets, die noch entsprechende Updates empfangen dürfen, als auch auf ganz neuen mit gleicher Präzision. Sogar in die Fernbedienung von Apple TV ist der Sprachassistent mit integriert und bietet hier zahlreiche Optionen.

Siri’s großer Vorteil gegenüber den anderen Assistenten ist die Anzahl der unterstützten Sprachen. So bietet Apple 21 Sprachen an, für 36 verschiedene Länder. Siri ermöglicht eine sehr gute Spracherkennung und ist auch in der Lage die individuelle Stimme des Sprechers zu erkennen. Doch leider steht diese Option für HomePod noch nicht zur Verfügung.

 

Cortana von Microsoft

Cortana von Microsoft ist überall verfügbar und man kann es  sowohl unter MacOS und iOS, als auch unter Android, Windows 10 und sogar unter der Xbox One verwenden.

So sind wichtige Termine, Erinnerungen und Notizen geräteunabhängig vorhanden. Aufgrund der Integration in das Windows 10 Betriebssystem ist Cortana in Desktop PCs und Notebooks am meisten verbreitet und bietet dem Benutzer eine gute Unterstützung für Office oder Outlook. Der persönliche Assistent von Microsoft speichert alle personenbezogenen Informationen direkt auf dem jeweiligen Gerät und gewährt dem Benutzer sogar einen Einblick in die gespeicherten Daten.

Um die Funktionalität seines persönlichen Assistenten zu erweitern, hat Microsoft angekündigt, dass ab 2018 auch Alexa neben Cortana in Windows 10 integriert wird. Wer welche Aufgaben bekommt, ist noch nicht klar.

 

Die zukünftigen Trends rund um intelligente persönliche Assistenten

Die Entwickler der intelligenten persönlichen Assistenten erweiterten ihre Anwendungssysteme durch Smart Hubs. Also Hausautomationssysteme, die eine nahtlose Anbindung sämtlicher Haushaltsgeräte, Thermostate, Fenster, Sicherheitsanlagen uvm. ermöglichen. Jedoch müssen die häuslichen Objekte über ein spezielles Format verfügen, welches mit dem jeweiligen System von beispielsweise Google, Amazon oder auch Apple kompatibel ist.

Die Automobilhersteller wollen Fahrzeuge mit intelligenten persönlichen Assistenten ausstatten, die Echtzeitdaten empfangen und vieles, was man heute noch manuell steuert, selbst erledigen können. Die Technologie kann den Fahrer beispielsweise an bevorstehende Meetings erinnern und ihm Abfahrtszeiten vorschlagen, die aktuelle Straßen- und Verkehrsbedingungen berücksichtigen.

 

Kontextuelles Verständnis

Die Zukunft der intelligenten persönlichen Assistenten ist im entscheidenden Maße davon abhängig, wie natürlich und flüssig die Kommunikation mit dem Benutzer verlaufen kann.

Damit ein echtes Gespräch oder nützliche Zusammenarbeit mit dem Assistenten erfolgen kann, ist es unerlässlich, dass dieser beispielsweise ein hohes Maß an kontextuellem Verständnis entwickelt. Der virtuelle Assistent muss dann nicht nur in der Lage sein viele Facetten der Kommunikation mit dem Benutzer für sich zu behalten, sondern sich an diese zum passenden Zeitpunkt erinnern.

Er muss einen Bezug zum bereits Gesagten herstellen können und schwierige Nuancen erfassen. Von allen Sprachassistenten ist Google am ehesten in der Lage den Kontext nachzuvollziehen. Jedoch ist der Assistent noch weit davon entfernt die unterschiedlichsten Nuancen der menschlichen Sprache zu verstehen. Viele Dinge, die für uns als selbstverständlich erscheinen wie beispielsweise “Lieblingsrestaurant” oder “stimmungsaufhellende Musik” stellen für die Sprachassistenten noch eine echte Herausforderung dar.

Eine Verbesserung des kontextuellen Verständnisses ist also einer der Schlüssel zum Erfolg solcher Systeme, da sie eine Interaktion ermöglichen, die mit der menschlichen vergleichbar ist.

Mehr Beiträge