Bereiten Sie Ihre Daten für Conversational AI mit Schema.org vor

Q: Was ist Schema.org und welches Ziel verfolgt die Initiative?

Schema.org ist aktuell der Quasi-Standard für die Annotation von HTML-Dateien mit semantischen Informationen. 2011 wurde Schema.org von den führenden Suchmaschinen Google, Bing, Yahoo und Yandex (führende Suchmaschine in Russland) als gemeine Initiative gestartet. Ziel war es damals, einen gemeinsamen Standard zu schaffen, der die Annotation von HTML-Dateien mit Informationen ermöglicht, die diese für (Such-)Maschinen besser auslesbar machen.

By Jürgen UmbrichPublished On: August 19th, 2020Categories: conversational ai

Wenn Nutzer mit Chatbots oder Sprachassistenten in natürlichsprachigen Dialogen kommunizieren, dann sind im Hintergrund fortschrittliche Techniken der künstlichen Intelligenz im Einsatz. Das ist das Einsatzfeld der an Bedeutung gewinnenden Disziplin der Conversational AI.

Conversational AI stützt sich auf das Vorhandensein von vollständigen, wohlstrukturierten Daten, die (zumeist) in Form von Knowledge Graphen modelliert werden. Möchte man als Organisation einen Chatbot oder Sprachassistenten entwickeln, stellt sich also die Frage: Wie können und sollen vorhandene Daten (z.B. Content auf der Webseite, interne Wissensdatenbank, Dokumentationen des Kundenservice) strukturiert und aufbereitet werden, sodass diese einfach und rasch von Conversational AI genutzt werden können?

Das wahrscheinlich beste Rahmenwerk sind hierfür die Definitionen und Schemata von Schema.org.

Was ist Schema.org und welches Ziel verfolgt die Initiative?

Schema.org ist aktuell der Quasi-Standard für die Annotation von HTML-Dateien mit semantischen Informationen. 2011 wurde Schema.org von den führenden Suchmaschinen Google, Bing, Yahoo und Yandex (führende Suchmaschine in Russland) als gemeine Initiative gestartet. Ziel war es damals, einen gemeinsamen Standard zu schaffen, der die Annotation von HTML-Dateien mit Informationen ermöglicht, die diese für (Such-)Maschinen besser auslesbar machen.

Es ist vor allem die Federführung durch Google, die dafür gesorgt hat, dass sich bereits jetzt sehr viele Unternehmen der Strukturierung ihrer Daten gemäß den Vorgaben von schema.org angeschlossen haben. Unternehmen entscheiden sich für die Strukturierung von Daten nach schema.org, weil sie bei Google bessere Rankings für ihre Seiten erzielen möchten. Aktuell fließt dabei noch kaum die Zukunft von Conversational AI und Voice Search in dieses Kalkül ein, dennoch setzt man mit schema.org auf das richtige Pferd.

Je früher Unternehmen auf schema.org setzen, desto besser

Davon sind wir überzeugt. Denn: die hohe Akzeptanz und weite Verbreitung der Vorgaben von schema.org im aktuellen Web und Googles Dominanz als Suchmaschine und bei Sprachassistenten mit Google Assistant legen diese Entwicklung nahe.

Google indiziert gemäß schema.org strukturierte Webinhalte einerseits, um die Beantwortung von Suchanfragen für Nutzer zu optimieren. Gleichzeitig nährt Google damit auch seinen eigenen Knowledge Graphen, der die Grundlage für die Beantwortung von Sprachanfragen mittels Google Assistant ist.

Der zunehmende Wechsel von textbasierter zu sprachbasierter Suche (Voice Search) lässt die Bedeutung von Conversational AI steigen. Conversational AI benötigt allerdings klar strukturierte Daten (etwa gemäß schema.org), um natürlichsprachliche und relevante Antworten liefern bzw. gewünschte Aktionen ausführen zu können. Unternehmen, die im bevorstehenden Voice First-Zeitalter gefunden werden wollen, müssen ihre Daten und Inhalte in strukturierter Form bereitstellen. Die Befolgung der Vorgaben von schema.org sind hierfür die optimale Vorbereitung.

Bestehende strukturierte Daten für Conversational AI nutzen

Bereits heute haben viele Unternehmen ihre Webinhalte zumindest teilweise nach den Vorgaben von schema.org aufbereitet. Ein großer Vorteil ist, dass dies schon jetzt bessere Google-Rankings ermöglicht. Im Zusammenhang mit Conversational AI ist dies vorteilhaft, weil diese Daten die Entwicklung von Chatbots und Sprachassistenten vereinfachen.

In Kooperation mit einem spezialisierten Experten wie Onlim kann dann durch Modellierung der Daten, zumeist mit einfachen Ergänzungen bzw. Anreicherungen, in einem Knowledge Graphen die Grundlage für durch Conversational AI-betriebene Assistenten gelegt werden.

Hier erfahren Sie mehr über die Knowledge Graph-Technologie von Onlim.

Strukturierung nach schema.org bringt mehrfachen Nutzen

Manche Unternehmen haben hingegen noch keine Strukturierung von Webinhalten vorgenommen. In diesem Falle sollte umgehend mit der Implementierung von schema.org begonnen werden. Denn, wie wir unseren Kunden stets raten, lassen sich so nämlich zwei (oder mehrere) Fliegen mit einer Klappe schlagen.

Zunächst optimiert man seine Webseite damit für Suchmaschinen wie Google und Bing. Bereits als reine SEO-Maßnahme betrachtet ist die Strukturierung nach schema.org sinnvoll. Die Aufnahme dieser Daten in einen Knowledge Graphen im nächsten Schritt ermöglicht, das volle Potenzial von Conversational AI zu entfalten.

Übrigens – falls Sie mehr über das Zusammenspiel von Knowledge Graphen und Conversational AI erfahren möchten, ist unser Whitepaper genau das Richtige für Sie.

Wie baut Onlim Conversational AI auf schema.org auf?

Hier bei Onlim haben wir uns entschieden, ebenfalls auf schema.org als Rahmenwerk für die Strukturierung von Daten zu setzen. Hierfür haben wir uns gleich aus mehreren Gründen entschlossen, immer unter dem Gesichtspunkt, welche Entscheidung für unsere Kunden langfristig am vorteilhaftesten ist.

Wir können damit sofort auf die Fülle an bereits vorhandenen, nach schema.org strukturierten Daten im Web zugreifen bzw. diese nutzen. Je nach Anwendungsfall erweitern und ergänzen wir die bereits strukturierten Daten für unsere Kunden. Wir sammeln strukturierte Daten, aggregieren und verknüpfen diese oder reichern diese an und erstellen daraus die Trainingsdaten für Conversational AI in Form eines Knowledge Graphen.

Das sei kurz am Beispiel eines Hotels illustriert: Fragt ein Nutzer „Hat dieses Hotel offen?“ wird die Absicht erkannt, nach den Öffnungszeiten des Hotels zu fragen. Dementsprechend kann ein Chatbot oder Sprachassistent auf die aktuellen Öffnungszeiten an diesem Tag zugreifen und diese als Antwort ausgeben.

Weitere Vorteile der Nutzung von schema.org

Gleichzeitig können wir unseren Kunden auch anbieten, dass wir in unserem Knowledge Graphen strukturierte Daten auch veröffentlichen bzw. dem Kunden bereitstellen. Kunden können diese Daten in ihre Webseite integrieren und somit ihre Suchmaschinenrankings verbessern.

Zudem könnten Unternehmen externe Daten auf schema.org-Basis einfach in das eigene Ökosystem integrieren. So können etwa Event-Veranstalter die Diskographie eines auftretenden Künstlers mit wenigen Klicks darstellen lassen. Im Gegenzug wird es auch leichter, die eigenen Produkte auf der Webseite anderer Unternehmen integriert zu bekommen.

Wir sind vom Ansatz der Knowledge Graphen zur Modellierung von Daten für Conversational AI überzeugt. Dabei ist schema.org quasi Branchenkonsens, wo erforderlich erweitern wir von Onlim das vorgegebene Schema.

Auch interessant: Knowledge Graphen zur Konversationsoptimierung von Chatbots

Alternative Ansätze sind möglich, haben allerdings Limitationen

Andere Marktanbieter verfolgen für ihre Conversational AI eigene Ansätze, die nicht auf Knowledge Graphen basieren und sind damit durchaus erfolgreich. Allerdings sind diese Ansätze mit massiven Einschränkungen verbunden.

Natürlich können auch nicht nach schema.org strukturierte Daten teilweise von Suchmaschinen und folglich von Conversational AI erkannt und genutzt werden – aber eben nur teilweise. Das wahre Problem individueller Lösungen zeigt sich spätestens dann, wenn eine Integration von externen Datenquellen erfolgen soll.

Etwa dann, wenn im Zuge des Ausbaus eines Voice Bots neue Abfragen bzw. Aktionen hinzugefügt werden sollen. Mangels gemeinsamer Standards und Definitionen können dann mühsame Anpassungen und Überführungen notwendig werden.

Alternative Ansätze können für Spezialfälle sinnvoll sein

Wir sehen individuelle Lösungen bzw. Schemen überall dort als sinnvolle Lösung, wo sich aufgrund der Spezifika des Anwendungsfalles eine maßgeschneiderte Struktur als überlegene Datengrundlage gegenüber der generischen Struktur von schema.org erweist.

In allen anderen Fällen raten wir Unternehmen allerdings stets dazu, bei der Annotation von Webinhalten mit semantischen Informationen auf schema.org zu setzen. Dies zum einen aufgrund der zuvor dargelegten Ursachen und weil die Vorgaben von schema.org in der Zukunft der Voice Search noch weiter an Bedeutung gewinnen werden.

Auch interessant: Voice Discovery richtig angehen – Strategien für die Voice-First Zukunft

Wie sieht die gemeinsame Zukunft von Conversational AI und schema.org aus?

Bereits 41% aller Besitzer von Geräten mit Sprachsteuerungen verwenden diese wöchentlich, Voice Search ist die Zukunft der Suche. Wir erwarten darum, dass schema.org in Zukunft auch speziell für Voice Search vorgesehene Klassen und eigenes Vokabular erweitert wird.

Es könnten Beschreibungen für auf Sprachbefehl basierende Aktionen wie Suchen, Antworten, Terminplanung, Bestellungen folgen. Auch API-Abfragen könnten in Zukunft vielleicht schon bald annotiert werden, etwa der Versandstatus zu Paketen bei Lieferdiensten.

Annotationen für Antworten könnten hilfreich sein, um Antworten in Zukunft aussagekräftiger zu gestalten. Ein Schema für Mehrsprachigkeit wäre ebenso sinnvoll, um die korrekte Aussprache eines Sprachassistenten zu gewährleisten. Etwa in dem Sinne „Dieses Wort wird in Englisch und Deutsch gleich ausgesprochen, aber in Französisch ist es anders auszusprechen.“

Was auch immer die Zukunft der Voice Search bringt, mit Onlim haben Sie einen kompetenten Partner für die Modelierung & Optimierung Ihrer Datenstruktur für Conversational AI. Gerne können Sie hier ein unverbindliches Gespräch vereinbaren.

Weiter

Mehr Beiträge

Bereiten Sie Ihre Daten für Conversational AI mit Schema.org vor

Was ist Schema.org und welches Ziel verfolgt die Initiative?

Je früher Unternehmen auf schema.org setzen, desto besser

Bestehende strukturierte Daten für Conversational AI nutzen

Strukturierung nach schema.org bringt mehrfachen Nutzen

Wie baut Onlim Conversational AI auf schema.org auf?

Weitere Vorteile der Nutzung von schema.org

Alternative Ansätze sind möglich, haben allerdings Limitationen

Alternative Ansätze können für Spezialfälle sinnvoll sein

Wie sieht die gemeinsame Zukunft von Conversational AI und schema.org aus?

Retrieval Augmented Generation (RAG)

Ist ein Voicebot das Richtige für mein Unternehmen?

Was ist Generative KI?

Kontakt

Sprache:

Unternehmen

Ressourcen

Partner

Aus unserem Blog