Menü

Alternative zu Google Analytics Website-Analyse mit Piwik

Mit Piwik bietet die Open Source-Welt eine echte Alternative zu Google Analytics. Und das Besondere: Die Daten speichern Sie auf Ihrem eigenen Server.
internet, webdesign, piwik, open-source, google, google analytics, websiteanalyse © Internet Magazin
Website-Analyse

Bereits die alten Ägypter nutzten den Zensus, um Steuern einzutreiben und potenzielle Arbeiter zu registrieren. Mühevoll mussten die Beamten von Haus zu Haus ziehen, um die Daten zusammenzutragen – ganz im Gegensatz zu den modernen Erhebungsverfahren von heute. Aktuell führt das Statistische Bundesamt den Zensus 2011 durch. Dafür wird ein Bruchteil der Bevölkerung konsultiert, die restlichen Informationen werden aus den Einwohnermeldeämtern bezogen.

Da ist es im Web nicht verwunderlich bei einer Technologie, die auf digitalen Datenaustausch aufbaut, dass die Analyse des Nutzerverhaltens ein Wunschwerkzeug der ersten Stunde war. Jedenfalls bei den Website-Betreibern. Unter anderem fand der Wunsch bei Google Gehör, und es wurde mit Google Analytics ein freies Werkzeug für diese Aufgabe geschaffen. Die einfache Einbindung in die Website via Code Snippet, die umfangreiche Feature-Liste und die damit verbundenen Diagnosemöglichkeiten haben diesem Trackingtool zu einem kometenhaften Aufstieg verholfen – und Google zu sehr großen, sehr vollen Datenspeichern.

Gerade auf jene haben es deutsche Datenschützer verstärkt abgesehen. Und so suchen viele nach Alternativen. Auch ein freies Systemhat sich in letzter Zeit besonders hervorgetan: Piwik. Seine Macher setzen dabei auf ähnliche Werte wie der Konkurrent Google. Einfache Installation und Integration, viele nützliche Tools und eine kostenfreie Lizenz zeichnen die Software aus. Der große Unterschied liegt in der Datenhaltung.

Während bei Google die Daten auf externen Servern lagern, werden bei Piwik alle Informationen auf einer lokalen Datenbank abgelegt und von keinem Dritten weiterverarbeitet. Die Applikation selbst liegt auch auf dem eigenen System und basiert auf der beliebten Kombination aus PHP und MySQL. Auf der Website wird ein kurzes Javascript Snippet eingebunden. Als Lizenz kommt die Standard-Open-Source-Lizenz GPL in Version 3 zum Einsatz.

Von Vorteil ist, dass Plugins nachinstalliert werden können, beispielsweise um die IP-Adresse zu anonymisieren. Die Datenverwaltung mehrerer Websites ist ebenso möglich wie die Zugriffsbeschränkung für weitere User auf eine Auswahl von Adressen. Und wem die assistentengestützte Konfiguration von Trackingmethoden nicht ausreicht, kann sich einer umfassenden API oder schon vorgefertigter Plugins bedienen.

Installation

Die Installation erfolgt in neun Schritten. Diese Zahl muss niemanden abschrecken, alle Schritte sind meist recht schnell erledigt. Auf piwik.org werden für die Installation fünf Minuten veranschlagt. Sofern man vorbereitet ist, kommt das auch in etwa hin. Dazu sollte man sich schon im Vorfeld eine neue Datenbank bei seinem Hoster ordern oder auf dem Server der Wahl anlegen. Natürlich können auch bestehende Datenbanken verwendet werden. Piwik nutzt standardmäßig ein Tabellenpräfix.

Oberfläche: Per Drag-and-Drop lässt sich das Dashboard anpassen. © Internet Magazin
Oberfläche: Per Drag-and-Drop lässt sich das Dashboard anpassen.

Die Core-Dateien stehen auf piwik.org als ZIP-Archiv zum Download bereit. Wer keinen SSH-Zugang besitzt, muss den Umweg über den lokalen FTP-Client gehen. Beim Upload via FTP ist darauf zu achten, dass die Daten im Binary Mode übertragen werden.

Sofern alles funktioniert hat, wird beim Aufruf des Piwik-Verzeichnisses im Browser (http://<Adresse>/piwik/ ) der Installer angezeigt.

In Schritt 1 begrüßt Piwik den Installierenden freundlich. Hier geht es direkt weiter. Bei Schritt 2 wird es etwas interessanter: Piwik prüft die PHP-Version, ob alle benötigten PHP-Erweiterungen vorhanden sind und ob die Dateiberechtigungen stimmen. Sollte es hier Probleme geben, hilft einem gegebenenfalls der Hoster weiter.

Anschließend wird im Schritt 3 die Datenbankanbindung eingerichtet. Falls die Tabellen in einer Datenbank mit bereits bestehender Struktur erstellt werden sollen, besteht die Möglichkeit, im vorletzten Feld der Eingabemaske das Tabellenpräfix zu ändern, Standard ist piwik_. Im Normalfall können die Vorbelegungen übernommen werden, lediglich der Datenbankname, der User und das Passwort müssen Sie ergänzen.

Mit der Bestätigung der Eingaben folgt die Datenbanküberprüfung und anschließend der Tabellenimport. Hier gibt es nichts zu erledigen, also weiter zu Schritt 6. Hier wird der Administrator oder – wie es bei Piwik heißt – der Superuser angelegt. Danach noch die URL und die Zeitzone angeben und als Letztes den generierten Javascript-Trackingcode in der Website vor dem schließenden Body-Tag eintragen.

Konfiguration eines Ziels: Ein Teil der Oberfläche ist noch englisch. © Internet Magazin
Konfiguration eines Ziels: Ein Teil der Oberfläche ist noch englisch.

In Schritt 9 erfahren Sie von der erfolgreichen Installation und können weitergehen zur Login-Maske. Damit ist Piwik fertig eingerichtet. Für kleinere Websites reicht das aus.

Wer möchte, kann die Dateirechte nach der Konfiguration noch etwas restriktiver gestalten. Dem Verzeichnis piwik/conf/ genügen Leserechte, da die Software nach der Erstkonfiguration jede weitere Einstellung in piwik/tmp/ speichert.

Automatische Archivierung

Die Ladezeit in Piwik erhöht sich gen unendlich und das System steht kurz vor dem Kollaps? Kern des Problems könnte die Auswertung der Statistiken sein: Ohne auto-archiving wird bei jedem Seitenaufruf in Piwik die Statistik neu berechnet. Bei einer sehr hohen Zahl an Page Impressions (Seitenzugriffe), ist das ein Horror für den Auswertenden. Der Installationsleitfaden weist am Dokumentende darauf hin, dass Webpräsenzen mit mittlerem bis hohem Traffic auf auto-archiving zurückgreifen sollten.

Zum automatischen Archivieren der Daten muss lediglich ein Skript turnusgemäß aufgerufen werden. Unter Linux wird das ganze via Cronjob erledigt, indem man Folgendes in die cron-tab-Datei einträgt:

MAILTO="email@adresse.de" 5 * * * * /pfad/piwik/misc/cron/ archive.sh > /dev/null



Selbstverständlich müssen Sie die E-Mailadresse und den Pfad zum Skript noch anpassen.

An die Adresse in der ersten Zeile gehen alle Fehlermeldungen, die durch den Skriptaufruf im Cronjob verursacht werden. Der Skriptaufruf in der zweiten Zeile leitet eine stündliche Archivierung ein. Windows-Systeme stellen für diese Aufgabe den Scheduler bereit. Die Konfiguration kann auf piwik.org/docs/setup-auto-archiving/ unter Punkt zwei nachgeschlagen werden.

Bei Webhosting-Angeboten mit lediglich einem Zugriff auf ein Interface, beispielsweise Plesk oder cPanel, gibt es meist ebenfalls Möglichkeiten, eine Art Cronjob anzulegen. Auch hier hilft eine Nachfrage beim Hoster. Unter der vorherigen Adresse finden Sie eine kurze Beschreibung zum Einrichten unter cPanel. Des Weiteren stehen am Ende des Dokuments ein Hinweis auf das Memory Limit und wie es erhöht werden kann sowie eine Erläuterung zur Autoarchivierung.

Zwei Einstellungsmöglichkeiten sind noch interessant: die Deaktivierung des durch Seitenabrufe in Piwik ausgelösten Archivierungsprozesses und die Einstellung der Zeitintervalle, in denen Piwik die Daten berechnet. Dabei beschränkt sich die Konfiguration auf drei Zeilen:

[General] time_before_today_archive_considered_ outdated = 3600 enable_browser_archiving_triggering = false



Den Code tragen Sie am Anfang der config/config.ini.php ein. In der ersten Zeile wird das Zeitintervall in Sekunden festgelegt, in der zweiten die Browserarchivierung. Mehr dazu finden Sie unter de.piwik.org/dokumentation/wie-richte-ich-die-automatische-archivierung-von-berichten-ein/ .

weiterlesen auf Seite 2
 
Whitepaper Lexware-Logo
Mindestlohn Das müssen Sie als Arbeitgeber prüfen.
Mindestlohn und Praktikanten Antworten zu häufig gestellten Fragen.
x