Vor einiger Zeit habe ich eine Auswertungssoftware für Tweets der Leipziger Verkehrsbetriebe geschrieben. Als guter Bürger mit einer (meiner Meinung nach) guten Beziehung zur PR/Online-Abteilung der LVB, habe ich vor der Veröffentlichung versucht eine Zusammenarbeit zu gestalten.
Dabei wollte mich die LVB nur über den Tisch ziehen, was ich lange Zeit nicht belegen konnte. Jetzt kann ich es.
Ich schreibe das hier ganz öffentlich und ehrlich, weil ich mir sehr sehr verarscht vorkomme und gerne Andere davor warnen möchte, für die LVB den nützlichen Idioten zu machen.
Am 22. August hatten wir uns zur Vorstellung der Applikation am Augustusplatz getroffen. Bei dem Treffen waren der Pressereferent (bekannt aus Twitter), die Kollegin, die die Meldungen normalerweise eingibt, der große PR-Chef und ein Kollege aus der Technik.
Bei dem Treffen wurde mir erklärt, welche Meldungen eigentlich ins Twitter reinkommen und welche nicht und in welchen Ebenen welche Störungen meldepflichtig sind undsoweiter. Dann habe ich die Applikation gezeigt und habe dargestellt, welche Straßenbahnlinie an welcher Stelle am schlimmsten von Falschparkern betroffen ist.
Der Kollege aus der Technik schien begeistert, denn deren Analysesoftware wäre weitaus weniger komplex. Die Kollegin aus dem Lagezentrum ebenso, denn diese Live-Erkenntnis war genau das, was sie aus ihrem Arbeitsalltag kennt.
Nur die beiden Herren aus der Presse waren wenig begeistert. Da könne man viel zu viel falsch verstehen. Am Ende einigten wir uns darauf: Ich bekomme das Twitter-Archiv der LVB und gebe die App nur für die KollegInnen frei. Die schauen, ob sie selbst was rauslesen können und wenn das Ganze als „sauber“ deklariert wird, darf ich die Daten mit benutzen. Fairer Deal?!
Nach einigem Nachfragen habe ich am 02. September die Daten erhalten. Da wurde ich schon stutzig, denn eigentlich hätte das Ganze schon am nächsten Werktag fertig sein müssen. Die Datei, die ich bekam, war offensichtlich in einem Programm (tippe auf MS Excel) geöffnet und manipuliert worden. In den Tweets seit Ende 2011 war 266 mal das Schlüsselwort „Unfall“ enthalten. Ich hatte in meinen 4 Monaten Daten schon knapp 270 mal „Unfall“ und mit den offiziellen Statistiken lässt sich das in zweieinhalb Jahren gleich gar nicht vereinbaren.
Und siehe da, es sind wirklich Meldungen gelöscht worden. Das erklärt die lange Wartezeit. Ich versuchte meine Kontaktperson darauf anzusprechen:
Hier eine Statistik, mit der ich das jetzt belegen möchte, dass die LVB erst nach meinem Treffen begonnen hat, unbeliebte Tweets in großem Maß zu löschen:
Die blaue Linie sind die Tweets in meinem Archiv, die rote Linie ist der Anteil, den ich als gelöscht identifiziert habe.
Die Daten habe ich seit Anfang April, weil ich Anfang Juli das verfügbare Archiv per Twitter-API runtergeladen habe. Das sind vollständige Daten über die letzten 3 Monate. Seitdem habe ich Live-Daten per Streaming-API und lade Nachts nochmal die Tweets des Tages runter (möglicherweise habe ich welche verpasst).
These: Die LVB löscht schon immer unliebsame Tweets. Wenn das so ist, sollten wir folgendes sehen: Die Rote Linie ist erst ab Juli über 0, denn im Rückblick über 3 Monate hinweg, hätten unliebsame Tweets längst gelöscht sein müssen. Dem ist nicht so.
Es bleibt also nur ein Schluss: Die LVB hat erst nach unserem Treffen angefangen, alte Tweets zu löschen. Tweets, die ihnen im Nachhinein, Monate später, nicht mehr gefallen haben. Das erklärt auch die langen Wartezeiten, bis ich die veränderten Daten erhalten habe.
Und das sieht man jetzt schon, nachdem ich gerade 20% der Tweets auf Verfügbarkeit gecheckt habe.
Das kommt davon, wenn man versucht *mit* einem Unternehmen zu arbeiten. Man wird verarscht. Ich berichte von meinem Plan, es gibt eine Abmachung und dann wird sabotiert. Ich habe meinen Teil eingehalten. Das mache ich auch weiterhin. Ich werde die manipulierten Daten nicht nutzen. Die bringen auch niemandem etwas. Auch nicht mehr der LVB, die davon vielleicht etwas hätten in Erfahrung bringen können.
Am ärgerlichsten ist dann eigentlich, für wie doof man mich hält.
So lernt man auch Dinge über Leipzig.
Und als Ergebnis dieser Aktion kann man ab morgen bei lvbstats auch nur nach gelöschten Tweets filtern.
Die beiden Herren aus der Presse sind sicher immer noch wenig begeistert, auch wenn es bei diesen Daten wenig falsch zu verstehen gibt…
Mensch Mario, du bist aber auch ganz schön naiv an die Sache rangegangen. Ist doch klar, dass der Begriff „Unfall“ in den Augen der LVB ein roter Begriff ist. Schön finde ich die Tatsache, dass du das Verhalten der LVB dokumentiert hast. Eigentlich ja fast schon ein tolles Thema für eine Bachelor-/Masterarbeit, oder?