Zum hauptinhalt springen

Regionalzeitungskarte mit Datawrapper und Wikidata

In diesem Text beschreibe ich wie ich die Idee der Zeitungskarte aus einem letzten Eintrag etwas verändert habe und diese jetzt anstatt aus Daten der BDZV-Website als propritäre Quelle, ausschließlich offene Daten aus Wikidata nutzt, um dieselbe Karte zu erstellen.

Neben dem Beziehen der Daten aus Wikidata enthält die Idee noch folgende Neuerungen: ein Batch (per Github-Actions) zieht einmal pro Tag den Datensatz aus Wikidata. Sollte sich dieser verändert haben, dann aktualisiert der Batch automatisch die Karte. Grundsätzlich brauche ich dazu nur den Namen der Zeitung und noch die Regionen oder Orte über die sie berichtet, bzw. in denen die Redaktionen liegen.

Durch das Verschieben der Datenquelle ergeben sich folgende Vorteile:

  • Ich bin nicht der Gatekeeper für die Daten. Das heißt jeder kann Inhalte eintragen und verändert so die Karte. Es handelt sich um Linked Open Data.
  • Auch brauche ich mir um den Verbleib der Daten, sowie das Datenmodell keine Sorgen machen, diese liegen in der Datenbank von Wikidata.
  • Und da Wikidata ein Graph ist können die für die Karte relevanten Informationen auch für andere Use-Cases genutzt werden.
  • Weiter Punkt, mit wenigen Änderungen kann der Ansatz für jedes beliebige Land in Europa wiederholt werden. Mit etwas mehr Aufwand auch für nicht-europäische Länder.

Hier ist die fertige Karte zu sehen, aktuell noch sehr unvollständig. Folgendes Bild skizziert die Entscheidungslogik, wann eine Zeitung angezeigt bzw. für ein NUTS3-Gebiet gezählt wird.

Vorläufige Karte aus Datawrapper

Anleitung zum Pflegen der NUTS Gebiete einer Zeitung

In Worten müssen also folgende Schritte gemacht werden:

  1. Registrieren eines Accounts für WikiData

  2. Entweder über die Liste auf dieser Seite oder eigenständig über die Suche auf Wikidata.org nutzen um eine Zeitung zu suchen, welche bearbeitet werden soll.

  3. Dann für die Relation “Erscheinungsort” die Regionen eintragen. Falls die Relation noch nicht existiert, habe ich weiter unten mal beschrieben wie das Neuanlegen geht.

  4. Diese Änderungen werden gegen Mitternacht aus wikidata heruntergeladen und aktualisieren dann die Karte unter wikidataMap.html

Diskussion

Für mich bleiben damit noch drei Punkte offen: einmal die verwendete Relation Erscheinungsort in Wikidata und deren Pflege über die Homepage.

Die Benutzung der Relation Erscheinungsort ist noch etwas unsicher. Auf der einen Seite verwenden einige Zeitungen diese Relation eindeutig zu dem Zweck, wie sie auch in der Karte verwendet wird. Auf der anderen Seite sind es meist gerade Regionalzeitungen, in denen die Relation noch gar nicht verwendet wird.

Auch finde ich die Pflege der Geodaten über die Relation in Wikidata nicht komfortabel. Ich stelle es mir nicht schwer vor, das opendatalab Tool entsprechend zu verändern und um eine Anmeldung per Wikidata-Account zu erweitern.

Das Problem der Einteliung einer Zeitung in eine Zombizeitung, war für die letzte Zeitung bereits aufgekommen und war damals und ist aktuell noch immer ungelöst. Vielleicht kann dieses Problem ja jetzt im Zuge der Bearbeitung der Daten in aller Öffentlichkeit einfach gelöst werden. Also entweder indem anhand bestehender Relationen diese Einteilung getroffen werden kann oder indem neue Daten eingefügt oder verknüpft werden können.

TODO

  • Ein Problem: Zeitungen wie die Wolfsburger Allgemeine Zeitung sind eine Zeitungs-Relation, aber berichten auch Regionalen content. Da die regional newspaper Definition aber eine obergrenze was die Auflage angehet beinhaltet, kann das ggf. nicht angewendet werden. Welche Modellierung ist hier anzuwenden? Diese Abfrage zeigt das Zeitungen noch einige interessante Entitäten enthalten

  • Weiter ist noch interessant das Abfragen auch schneller werden können, wenn sie mehr einschränkungen enthalten (meistens, weniger optional/union anteile)