Datengrundlage Web-Statistik

Datengrundlage der WebStatistik sind automatisch erfasste Daten wie folgendes Bsp. für den Aufruf einer WebSite. Jeder Aufruf, auch „Hit“ genannt, wird immer chronologisch erfasst und sieht bspw. wie folgt aus (Eltz, 2022)*:

171.151.291.19 – – [28/Nov/2021:08:04:22 +0200] „GET /images/logo.jpg HTTP/1.1“ 200 512 „http://www.wikipedia.org/&#7542” “Mozilla/5.0 (Macintosh; Intel Mac OS X 10.15; rv:77.0)”

Dies ist ein Beispiel eines Logfiles. Es enthält folgende Informationen:

  1. 151.291.19: IP-Adresse – muss aus Datenschutzgründen nach der Datenschutzgrundverordnung (DSGVO) anonymisiert werden.
  2. – –: Benutzername und Passwort, falls ein Login erfolgte.
  3. Timestamp: Datum und Uhrzeit des Zugriffs plus Zeitverschiebung.
  4. Operation: GET ist der Befehl, um auf eine Datei zuzugreifen. /images/logo.jpg bezeichnet die angeforderte Datei – in diesem Fall ein Bildformat. HTTP/1.1 stellt das Übertragungsprotokoll dar.
  5. 200 512: 200 bezeichnet einen Statuscode und bedeutet „erfolgreiche Anfrage“, 512 stellt die Größe der übertragenen Datei in Bytes dar.
  6. „http://www.wikipedia.org/ᵶ: stellt die Seite dar, von der aus die Anfrage erfolgt
  7. “Mozilla/5.0 (Macintosh; Intel Mac OS X 10.15; rv:77.0)”: Bezeichnet den Webbrowser, das Betriebssystem und die Oberfläche und wird oft als User/innen-Agent bezeichnet.

(Butler, D. 2015)

Im folgenden schauen wir uns verschiedene Arten von Analysen näher an:

Diese Seite ist im Aufbau

*Die folgenden Ausführungen basieren u.w. auf einer unveröffentlichte Projektarbeit von Michael Eltz am Lehrstuhl für mittelstandsorientierte BWL der TH Brandenburg, 2022.