Correlate: Neues Statistik-Tool aus den Google Labs

commander@giga

Googles Ideenschmiede Google Labs hat mal wieder ein interessantes Werkzeug hervorgebracht: Mit Correlate lassen sich Daten analysieren und sich ähnelnde Muster darstellen. Dabei ist man nicht auf Suchbegriffe beschränkt, sondern kann eigene Datensätze importieren. Man muss es sich ein wenig vorstellen wie ein umgedrehtes Google Trends. Aber am besten erklärt man es wohl an einigen Beispielen.

Seit langem bekannt ist Google Trends: Man hat einen bestimmten Begriff, in diesem Beispiel Winterreifen, und möchte wissen, wie das Suchverhalten zu diesem Begriff über einen bestimmten Zeitraum lief. Als Ergebnis erhält man eine Grafik, die in etwa so verläuft:

Erwartungsgemäß steigt die Suche nach Winterreifen im Herbst merklich nach oben. Weil uns das der gesunde Menschenverstand auch so verrät, ist diese Suche im Grunde sinnlos. Nun haben wir aber den Fall, dass uns der Suchverlauf bereits bekannt ist – und wir nun Werte suchen, die mit diesem zusammenfallen- also korrelieren.

Hier kommt nun eben Google Correllate zum Einsatz. Geben wir hier Winterreifen als Begriff ein, erhalten wir das bekannte Muster. Darüber hinaus jedoch noch einen zweiten Verlauf, der ein ähnliches Muster aufzeigt:

Kurioserweise weist der Suchstrang college basketball preview eine bemerkenswerte Ähnlichkeit auf. Dies ist wohl saisonal bedingt, zeigt aber auch, dass Google Correlate sich derzeit wohl nur auf US-Suchanfragen stützt. Erkennbar auch daran, dass man auf der Seite auch verschiedene US-Staaten (und nur diese) miteinander vergleichen kann.

Das Berechnungsprinzip beruht auf dem Pearson Correlation Coefficient und ich habe keine Ahnung, was das bedeutet. Wer sich also genauer damit befassen möchte, kann auch zum bereitgestellten FAQ oder zum Tutorial greifen – wahlweise auch zur stark simplifizierten Version in Form eines Comics.

Mit dem Vergleich von Suchbegriffen ist es bei Google Correlate jedoch noch nicht vorbei. Angemeldete Nutzer können auch eigene Datensätze importieren und diese vergleichen. Ergebnisse lassen sich als .csv exportieren oder auch via Facebook, Twitter oder Google Buzz verbreiten, wenn man ohnehin dabei ist, alles über sich preiszugeben. Eher Spielerei als nützlich ist wohl die Möglichkeit, einen eigenen Graphen einzuzeichnen und diesen nach passenden Suchbegriffen abzuklopfen. Die Search by drawing-Funktion scheint mir jedenfalls ein wenig zu minimalistisch, um sie für professionelle Andwendungszwecke verwenden zu können.

IT-Analyse-Analyst (das stimmt wirklich) Sean Power hält Googles Veröffentlichung von Correlate für konsequent. Gegenüber ReadWriteWeb erklärt er:

“Correlate: Wir werden Ankündigungen wie diese von Google in den nächsten Quartalen noch häufiger erleben. So wie Amazon den Anteil an (Netz-)Infrastruktur besitzen möchte, muss Google den Anteil an Statistiken besitzen, um in seinem Kerngeschäft bestehen zu können. Mit großen Update wie Trends und Analytics, so wie noch unbekannten Tools wie BigQuery wird Google ein Major Player in seinem Bereich bleiben.”

Klar: Googles Kerngeschäft sind Informationen. Das Unternehmen kann demzufolge nie genug davon haben. Es ist also in seinem Interesse, dass jeder seine Datensätze an Google abgibt, um sie dort bequem und nahezu ohne Aufwand analysieren zu können. Ob dies jedoch auch im Interesse der Nutzer sein kann, sei einmal dahingestellt. Google selbst verspricht jedenfalls, vertraulich zu handeln: “Google Correlate kann niemals genutzt werden, um individuelle Personen zu identifizieren, da wir unsere Analysen auf anonymisierte, aggegierte Zahlen darüber aufbauen, wie oft Suchbegriffe in einer Wche auftauchen.” Dies gilt freilich nur für die Correlate-Nutzung, in der eben Suchbegriffe miteinander verglichen werden.

Download
Correlate
Neues Statistiktool aus den Google Labs

Neue Artikel von GIGA SOFTWARE

GIGA Marktplatz