Semantic Web: Suchgiganten einigen sich auf Standards

commander@giga

Von Beginn der Internetsuche an träumen Entwickler vom Semantic Web: der kontextbasierten Suche, die dem Nutzer genau das Ergebnis liefert, nach dem er fragt. Google, Microsoft Bing und Yahoo gehen nun einen großen Schritt nach vorne. Mit einer standardisierten Verknüpfung von Inhalten lassen sich einzelne Begriffe nun genau definieren.

Semantik, also die Füllung eines Begriffs mit einer Bedeutung, ist etwas, was Suchmaschinen wohl nie leisten werden können. Zu komplex sind die Zusammenhänge, die sich dem Menschen aufgrund seines Wissens und seiner Erfahrung schon in wenigen Augenblicken erschließen. Sucht der Nutzer in Google nach “Sieben”, kann er entweder David Finchers Meisterwerk meinen, die Zahl oder das Verb. Google weiss das nicht und liefert ihm einfach alles, geordnet nach vermeintlicher Relevanz. Das Semantic Web soll es eines fernen Tages möglich machen, genau diesen Wildwuchs einzuschränken. Dem steht ein großes Problem entgegen: Die Verknüpfung der Begriffe mit Kategorien ist nur durch mühsame, menschliche Handarbeit machbar. Und bislang fehlte es an Standards, wie dies erfolgen soll.

Bis jetzt: Die drei Suchgiganten Google, Bing und Yahoo haben mit schema.org eine Plattform aufgesetzt, die genaue Codeschnippsel enthält, an denen sich die Contentlieferanten bei der Erstellung von Inhalten orientieren können. Die Suchmaschinen versprechen, dass diese Einteilungen in Zukunft erkannt und entsprechend zugeordnet werden. In einem aufgesetzten FAQ erklären die Unternehmen, dass es zwar schon andere Ansätze gäbe, die Schemas aber vor allem für Suchmaschinen relevant seien – und da wäre es wichtig, dass die größten der Branche zusammenarbeiteten. Man legt auch Wert auf die Feststellung, dass es sich hierbei nicht um den Versuch handele, einen offiziellen Standard durchzudrücken. Sondern dass man lediglich Codes zur Verfügung stellt, die von Google, Microsoft und Yahoo unterstützt würden – was jedoch effektiv auf einen Standard hinauslaufen könnte.

Die Funtkionsweise der Schemas wird klar, wenn man sich den Aufbau anhand eines Filmes als Beispiel ansieht. In der bisherigen HTML-Ansicht könnte eine Information so aussehen:

Ein schlichter Text, aus dem sich die Suchmaschine der Wahl beim Durchpflügen des Webs einfach bedient. Wenn es nach Google und Co. geht, sieht das aber schon bald so aus:

Hier wird zunächst festgelegt, dass es sich um den Film Pirates of the Caribbean handelt. Außerdem erhalten Beschreibung, Regisseur, Autoren, Schauspieler und allerlei sonstige Beteiligte eigene Kategorien, die von den Suchmaschinen auch als solche erkannt werden.

In Zukunft wird es wichtig werden, dass nicht nur die “normalen” Webseitenbetreiber umstellen, sondern dass vor allem die Größen des Internets mitspielen. Da wäre natürlich zuvorderst Facebook zu nennen. Von dessen Algorithmus Open Graph hält man daher nicht zu viel: “Facebook Open Graph erledigt seine Aufgabe ganz gut, bietet aber nicht die detaillierten Informationen, die von Suchmaschinen benötigt werden, um die Nutzererfahrung zu verbessern.”

Das Dreiergespann Google, Microsoft und Yahoo stört sich daran, dass Webseiten eben aus mehreren Elementen bestehen können als Facebook bietet, und dass ihre Schames detaillierter sind als die Verlinkungen, die Open Graph erlaubt.

Bild: Linked Data (Semantic Web) candies von reedster (cc)

Schema.org
Zusammenstellung von Semantic Codes für Webentwickler.

Neue Artikel von GIGA SOFTWARE

GIGA Marktplatz