Bis vor kurzem war Googles Data Studio ein geschlossenes System. Spannend wurde es, als Google dieses Jahr das Data Studio als offene Version anküdigte. Damit konnte man unabhängig vom Analytics 360 Programm auf ein cloudbasiertes BI Tool zugreifen, welches Datenquellen wie SQL-Datenbanken, Google Spreadsheets, AdWords, Google Analytics, etc. verbindet. In einem Dashboard werden alle Daten nebeneinander visualisiert. In diesem Beitrag zeige ich die Kernfunktionen in einem Showcase von Whiskeyblog.de. Funktionen wie Segmentieren und Pivotieren sind per se nicht verfügbar, mit ein paar Tricks klappt aber auch das.
Inhaltsverzeichnis
Whiskeyblog.de Showcase
Um diesem Blogbeitrag besser folgen zu können habe ich ein offenes Data Studio Dashboard angelegt. Ihr könnt die Daten des Blogs whiskeyblog.de live nachvollziehen – die Daten werden täglich aktualisiert. Alle Beispiele in diesem Beitrag könnt ihr also im Dashboard nachvollziehen:
https://datastudio.google.com/u/1/#/org//reporting/0B7qibkH7Ec8QYjZfcjRwel9vMnc/page/Xlp
Erste Schritte in Googles Data Studio
In den letzten Jahren hat sich ein reger Marktplatz für BI Tools entwickelt, auf dem vor allem Webbasierte Cloudlösungen boomen. Microsofts Power BI, Tableau und nun auch Data Studio bieten eine ähnlichen Lösungsweg für ein klassisches Problem. Viele Datenquellen aber wie verbindet, teilt und visualisiert man sie? Vielleicht dauert es nicht mehr so lange bis wir endlich die Excel Ära überwunden haben? Man darf ja noch träumen.

Google Data Studio hat eine überschaubare Werkzeugleiste, fürs erste ausreichend
Erste Schritte im Data Studio macht man über die Werkzeugleiste. Man kann statische Texte (Überschriften, Disclaimer, …) einfügen, Diagramme und dynamische Filter. Filter passen die Visualisierungen dynamisch an und werden vom Nutzer beim Betrachten definiert.
Diese Werkzeuge werden in Kombination mit den Daten verwendet, die man über zu definierende Datenquellen bezieht. In unserem Beispiel fangen wir mit Google Analytics Werten an, die am einfachsten integriert werden können über eine Webauthorisierung (Login bei Google). Jeder Nutzer meines Dashboards sieht die Daten, die ich über meinen Login zur Verfügung stelle. Der Nutzer muss keine Berechtigung in Google Analytics vorweisen, da mein Account die Brücke darstellt.

Google Analytics als Quelle bietet die Möglichkeit einzelne Dimensionen darzustellen aber nicht zwei unterschiedliche Dimensionen in einem Diagramm
Verschiedene Dimensionen und Kennzahlen ermöglichen die Sicht auf Visits, Landingpages, usw.. Kombinationen aus der Datenquelle Google Analytics ermöglichen jedoch nicht das freie zusammenlegen verschiedener Datenpunkte in einem Diagramm. Die Kurve bleibt fürs erste auf Visits beschränkt.
Flexibler ist die Darstellung wenn man eine flache Tabelle als Quelle angibt, z.B. Google Spreadsheets.

Visits gesamt und für einen Channel gemeinsam in einem Chart – mit Google Analytics alleine als Datenquelle nicht möglich
Unterschiedliche Datenpunkte können gemeinsam dargestellt werden, wenn die Quelle beide Werte in einem Zeitverlauf anbietet. So flexibel wie Google Spreadsheets ist Google Analytics als Datenquelle nicht, da die Summe der Sessions und die Dimension „Channel“ nicht gemeinsam verfügbar sind.
Ich habe deshalb zum Überbrücken ein Spreadsheet angelegt, welches über die GA API Daten zusammenfasst und in einer flachen Tabelle darstellt. Einfach Sessions als Kennzahl und Date als Dimension definieren, in einem zweiten Report zusätzlich zum Date auch Default Channel auswählen. Über einen VLOOKUP (oder SVERWEIS) können die Daten so arrangiert werden, dass sie eine Kopfzeile und Werte nach Datum haben. Fertig ist die Datenquelle für das Diagramm im Bild oben.
Google Analytics Segmente in Data Studio
Segmente sind bisher (Stand Okt 2016) in Data Studio nicht verfügbar, wenn man Google Analytics als Quelle definiert. Ihr ahnt es schon: Spreadsheets als Quelle kann natürlich segmentierte Daten beziehen und dient dann wieder als Brücke zum Data Studio. Beispielhaft nehmen wir uns die Top 10 Landingpages im ersten Request und beziehen dann segmentierte Daten für die Landingpages in separaten Requests. So können wir immer dynamisch auf aktuelle Top 10 zurückgreifen und diese als Segmentparameter nutzen.

Eine flache Tabelle aus Google Spreadsheets kann einfach mit VLOOKUP (SVERWEIS) gebaut werden
Diese Kaskade ist ein beliebter Weg um sich erst einen Überblick zu verschaffen und dann auf das Ergebnis der ersten Abfrage zu reagieren und weitere Daten zu ziehen. Somit spart man sich einen großen Request, bei dem die meisten Daten nicht relevant sind. Und umgeht so auch nebenbei das Sampling. Man wird dann im Spreadsheet das Google Analytics Plugin so konfigurieren müssen, dass die Reportdefinitionen mindestens zwei Mal hintereinander loslaufen um Daten zu ziehen.

In Spreadsheets können GA Daten über die API frei konfigurierbar bezogen werden
Die zweite Konfiguration im Bild enthält als Segment den Wert des landingPagePath aus dem ersten Ergebnis für das Reporting „top10LandingPages“. In diesem Beispiel die Landing Page „/“ (Startseite). Wir beziehen also zuerst die Top 10 und fügen die Ergebnisse dieser Abfrage in die Segmente für eine zweite Abfrage ein.
Google Data Studio Filter
Ähnlich wie schon bei den Segmenten muss man sich vorab Gedanken machen über Datenquellen und wie diese aufgebaut sind, bevor man die Filter definieren kann. Eine Tabelle kann Dimensionen mit vielen Ausprägungen haben oder jede Ausprägung mit Kennzahl kombiniert. Dazu ein grundlegendes Beispiel:

Data Studio akzeptierte beide Formen, jedoch kann nicht jede Quelle gefiltert werden
In Tabelle A haben wir ein klassisches Beispiel einer Dimension „Obst“. Jede Ausprägung dieser Dimension kann aber pivotiert werden (Tabelle B). Dann kombiniert man Kennzahlen mit Ausprägungen der Dimensionen.
Google Data Studio kann Filter nur auf Tabellen des Typs A anwenden. Jede Ausprägung wird dann als Filterkriterium angeboten. Der Aufbau B eignet sich für andere Fälle, so z.B. in meinem ersten Beispiel in dem Sessions gesamt und für einen speziellen Channel nebeneinander dargestellt wurden.
Gefahr läuft man mit den Tabellen des Typs A wenn die Anzahl der Ausprägungen sehr hoch ist. Dann wird nämlich jede einzelne als Filter angeboten, ein Filter auf die Top X ist nicht einfach möglich. So z.B. mit Landingpages, von denen man schnell über 1.000 haben kann. Filtert man eine Page heraus so rückt sofort eine neue in der Darstellung nach. Das ist unübersichtlich.

Viele Filterkriterien können die Darstellung schnell kaputt machen
In diesem Beispiel sieht man, dass bei solchen Fällen wie Landingpages die Grafik nie übersichtlich wird, da immer weitere Kurven nachrücken wenn eine ausgeblendet wird. Hier müsste man sich einen Filter definieren, der bei der Datenquelle hinterlegt ist. Um die Anzahl der Filter und Graphen im Diagramm zu begrenzen. Da man keine dynamischen Werte in Data Studio Filter angeben kann ist die Funktion derzeit noch etwas beschränkt.
Auch hier können wir die Felder sonst vorfiltern um die Filter für die Nutzer anzupassen. Entweder in der Datenquelle Google Analytics, z.B. über Regex, oder wieder über Spreadsheets und dort die API mit entsprechenden Filtern ansprechen.
Eigene Datenquellen-Felder definieren
Berechnete Kennzahlen können mit Formeln in Google Data Studio erstellt werden. Dazu hat Google eine Liste an Funktionen hinterlegt, die in den Formeln verwendet werden können. Mit dieser Funktion können Kennzahlen wie eine ganz bestimmte Conversion Rate zu einer Quelle angelegt werden, indem ein Quotient aus zwei gegebenen Zahlen genutzt wird.
Ein konkretes Beispiel wäre die Zählung bestimmter Werte in einer Dimension, wie häufig kommt „Apfel“ in der Dimension Obst vor? Hier wählt man die Summe mit der Bedingung Dimension A = „Apfel“.
1 |
SUM(CASE x THEN y ELSE z) |
Leider ist die Referenz auf eine Kennzahl nicht möglich um eigene Pivot-Dimensionen anzulegen. Folgende Formel ist also bisher leider nicht möglich:
1 |
SUM(CASE ga:channelGrouping = "Organic Search" THEN ga:sessions ELSE 0) |
Ihr könnt aber einfach die „THEN ga:sessions“ durch „THEN 1“ ersetzen um eine einfache Zählung zu erreichen. Wenn der Wert Organic Search auftaucht dann zähle „1“ sonst „0“.
Fazit
Googles Data Studio ist ein spannendes Tool um Daten aus dem Google Universum darzustellen. Die Benutzung ist einfach und die Lernkurve nicht zu steil. Leider müssen jedoch immer wieder Umwege genommen werden um die Daten genau so zu bekommen wie man sie sich vorstellt. Im Wettbewerb der cloudbasierten BI Tools liegt Data Studio noch nicht vorne, aber als kostenfreies Tool auf jeden Fall eine schöne Option für KMU.
Nachdem ich einige Reports und Dashboards mit Google Data Studio erstellt habe, muss ich sagen: es ist ein Tool mit tollen Möglichkeiten.
Besonders gut gelungen ist die einfache und schnelle Erstellung von Diagrammen und Datentabellen. Gleichzeitig ist man in der visuellen Anordnung und der inhaltlichen Zusammenstellung sehr flexibel. Das Customizen geht durch gute Formatierungsmöglichkeiten und das Einbinden eigener Bilddateien ebenfalls leicht von der Hand.
Auch die einfache Anbindung der Google-Produkte Analytics, Adwords, Attribution und Optimize ist sicher ein Bonuspunkt. Weitere Datenquellen wie etwa BI-Systeme können gut per SQL angebunden werden. Data Studio ist ein Produkt, mit dem andere Analytics-Tools noch nicht mithalten können. Einzig AT Internet ist eine seltene Ausnahme, die eine vergleichbar gute Lösung anbietet. Adobe Analytics hat mit den Workspaces gute Schritte in der Visualisierung nach vorn gemacht, kommt aber ebenfalls nicht an die Möglichkeiten von Data Studio heran.
Es gibt jedoch auch (noch?) zwei Kritikpunkte:
1. Data Manipulation: Wer die Daten jedoch vorher noch verändern will, dem hilft auch Data Studio nicht weiter. Dann muss weiterhin auf eigene Dashboard-Lösungen oder Google Docs in Kombination mit Scheduling-Addons gearbeitet werden.
2. Scheduling: Eine Funktion zum automatisierten Versand der Data Studio-Reports lässt noch auf sich warten.