Mittwoch, 19. Januar 2011

Datenpanne bei der KID

Ende letzten Jahres gab es eine kleine Datenpanne bei der KID, dem städtischen IT-Dienstleister von Magdeburg. Nun gibt es eine Stellungnahme dazu, die auf der Website von Magdeburg veröffentlicht wurde. Auf dieser Seite kann man sich die Stellungnahme herunterladen.
http://ratsinfo.magdeburg.de/vo0050.asp?__kvonr=212802
Einfach das verlinkte PDF auf der Seite öffnen...

Dazu habe ich ein paar kleine Anmerkungen. Vorweg möchte ich kurz sagen: Solche Fehler können passieren und sind in meinen Augen absolut kein Weltuntergang. Allerdings denke ich, dass eine solche Stellungnahme auch den tatsächlichen Gegebenheiten entsprechen sollte.

Folgende Punkte möchte ich daher anmerken:

1. Die Stellungnahme schreibt: "Dieser Zugriff wurde durch die Veränderung einer öffentlich zugänglichen Internetseite (Wunschkennzeichenreservierung der LH Magdeburg) möglich. Es handelte sich um eine gezielte Manipulation von Internetlinks bzw. -adressen von außen."

Dies sehe ich anders! Die Seiten waren bereits teilweise im Google-Index, was für mich recht klar zeigt, dass ein automatischer Crawler die Seiten entdeckt hat. Der Crawler von Google macht meines Wissens keine gezielte Manipulation von URLs, so dass er offensichtlich irgendeinem Link gefolgt sein muss, der auf diese Seite geführt hat. Es kann meiner Ansicht nach also durchaus sein, dass jemand zufällig über diese Lücke gestoßen ist.

2. In der Stellungnahme steht: "Die KID Magdeburg speichert für die auf den Servern gehosteten Internetpräsenzen der Landeshauptstadt Magdeburg keine IP-Adressen. Stattdessen werden für jeden Zugriff anonymisierte IP-Adressen (127.0.0.1) für Auswertungszwecke gespeichert.
Die KID Magdeburg GmbH führt hierzu aus: Es waren lediglich die Namen der Webhosting-Kunden der KID und die Summe der Zugriffe auf deren Internetseiten - keine Namen oder IP-Adressen - erkennbar."

Das ist so nicht ganz korrekt. Zwar hatte man keinen Zugriff auf die Logs der KID und somit keinen Zugriff auf den Großteil der IP-Adressen. Allerdings konnte man für die einzelnen Seiten in den Statistiken die Top 10 Besucher einsehen. Darin standen vollständige IP-Adressen oder aufgelöste Hostnamen, die ggf. sogar noch mehr Informationen enthalten können, wie eine IP-Adresse. Bspw. den Provider, oder die jeweilige dynamisch vergebene ID des Nutzers während seiner zu dem Zeitpunkt genutzten Session.

Sicher sind diese Informationen recht wenig wert, allerdings ist die obige Aussage, dass keine IP-Adressen einsehbar waren, falsch. Außerdem lässt dies noch weitere Schlüsse zu. Ich gehe davon aus, dass die Statistiken durch eine regelmäßige (wahrscheinlich tägliche) Auswertung der Serverlogs stattfinden. Damit in den Statistiken vollständige IP-Adressen landen können, müssen sie auch in den Log-Files stehen. Damit ist für mich auch die Aussage zweifelhaft, dass keine IP-Adressen gespeichert werden.


Ich persönlich bin der Ansicht, dass es in Ordnung sein sollte IP-Adressen zu speichern. Die Gesetzeslage ist alles andere als sinnvoll. Allerdings hätte ich es hier besser gefunden, wenn die Stellungnahme hier nachvollziehbarere Angaben gemacht hätte. Bspw: "Die Speicherung von IP-Adressen war eine gängige Praxis und die Konfiguration wurde noch nicht der aktuellen Rechtsmeinung angepasst. Wir haben unsere Log-Files nun auf ein anonymisiertes Format umgestellt und alte Logs gelöscht..."

Wie gesagt, es ist eigentlich kein Beinbruch, was passiert ist. Diese Stellungnahme hat mich allerdings schon sehr gewundert, da ich mir hier mehr Ehrlichkeit gewünscht hätte.