Leitfaden GEONIS Datenqualität

Das Fundament eines GIS ist die Qualität der erfassten Daten! 

Mit Hilfe von Geodaten werden heutzutage oft wichtige Entscheidungen wie etwa Planungen, Simulationen (Störungen im Werkleitungsnetz) oder für Modellrechnungen (Überschwemmungsmodelle) usw. getroffen. Diese Entscheidungshilfen aus den Geodaten können immer nur so gut sein wie die Geodaten selbst.

Geodaten stellen enorme Werte dar. Schätzungen gehen davon aus, dass rund die Hälfte der anfallenden Kosten für den GIS-Betrieb auf die Beschaffung und Sicherstellung der Geodaten zurückzuführen ist. Die Datenqualität muss deshalb das Ziel jedes GIS-Einsatzes sein. Sie ist DIE Voraussetzung, um ein GIS effizient einsetzen zu können.

Erfahren Sie, welche Hilfsmittel Ihnen bei der Sicherstellung der Datenqualität zur Verfügung stehen.
Leitfaden GEONIS Datenqualität (PDF)

Inhalt

  • Zwingende Qualitätsmerkmale für GEONIS
  • Werkzeuge zur Qualitätssicherstellung
  • Übersicht der Datenqualitätswerkzeuge
  • Mehrwert von Datenqualität
  • Weg zur Verbesserung der Datenqualität
  • Unterstützung

Ausgangslage

Heutzutage werden laufend Unmengen von Daten erhoben und abgelegt. Da die Produktion der Daten i.d.R. viel einfacher ist (z.B. digitale Fotos) als die korrekte Ablage und qualitative Weiterverarbeitung, versinkt man oft in der Datenflut ohne einen wirklichen Mehrwert.
In einem Geographischen Informationssystem (GIS) ist das nicht anders. Im Gegensatz zu reinen Sachdatenbanken, die u.a. redundanzfrei und konsistent sein sollten, spielt bei GIS-Systemen die topologische Korrektheit zusätzlich eine sehr wichtige Rolle. Der grundlegende Zweck der Topologie besteht darin, die räumlichen Beziehungen der Objekte untereinander zu gewährleisten und die Datenerfassung mit Hilfe von Regeln zu unterstützen.

Die Entwicklung der Netz-Dokumentation:

Entwicklung Netz-Dokumentation

Leider wird bei der Datenerfassung in einem GIS v.a. der Topologie zu wenig Beachtung geschenkt. Die Folgen davon sind, dass unzählige (neue) Funktionen und Produkte nicht verwendet werden können. Graphisch ist die fehlende Topologie nicht ersichtlich, und der Plan sieht «schön» und richtig aus, wie früher auf den analogen Plänen. Dadurch wird aber ein wichtiger Mehrwert eines GIS nicht genutzt.

Qualitätsmerkmale

In Geografischen Informationssystemen versteht man unter Datenqualität die Güte von Daten. Häufig kommen folgende Kriterien zur Anwendung:

 

Qualitätskriterien

Aktualität (Timeless)
Die Aktualität beschreibt die zeitliche Gültigkeit der Geodaten und kann zum Beispiel über ein Erfassungsdatum spezifiziert werden.
Die Aktualität kann aber auch über eine unternehmensinterne Richtlinie definiert werden, z.B. die Daten müssen Tages-, Wochen- oder Monats-aktuell sein.

  • Nachführungsqualität / Meldewesen sicherstellen

Genauigkeit (Accuracy)
Der Begriff Genauigkeit ist unterschiedlich auslegbar. Zum einen bezieht er sich auf die räumliche Lage der Geodaten (Lagegenauigkeit absolut zu einem übergeordneten Koordinatensystem oder relativ zu anderen Objekten), zum anderen kann er die thematische Genauigkeit bezeichnen. Darunter versteht man die Detailtiefe der Sachinformationen, z.B. die Anzahl der Kabeltypen in einem Elektrokataster.

  • In den Erfassungsrichtlinien festhalten

Konsistenz (Consistency)
Unter Konsistenz versteht man die logische Richtigkeit der Geodaten. Hierunter fällt unter anderem die Topologie, aber auch die gleiche Aktualität verschiedener Objekte innerhalb eines Datensatzes oder auch mehrerer Datensätzen (keine Widersprüche). Gerade bei vernetzten Systemen ist durch geeignete Schnittstellen die Datenredundanz zu eliminieren.

  • Topologie- und Sachdatenchecks ausführen (Erfassungskontrolle)

Richtigkeit (Rightness)
Der Begriff Richtigkeit ist im Sinn von fehlerfrei zu verstehen, d.h. die Daten müssen mit der Realität übereinstimmen.

  • Plausibilitätstests durchführen

Vollständigkeit (Completeness)
Ein Datensatz ist qualitativ vollständig, wenn die notwendigen Daten komplett für ein Gebiet vorliegen und alle Sachinformationen befüllt sind.

  • Ob ein Datensatz qualitativ vollständig ist, hängt von seinem späteren Verwendungszweck(en) ab = in den Erfassungsrichtlinien festhalten

Datenqualität sicherstellen

Je stärker Abläufe automatisiert und so der Vorteil von vernetzten Systemen genutzt wird, umso wichtiger sind «saubere» Daten. Nachfolgend sind sieben Schritte aufgelistet, die helfen sollen, die eigenen Daten aufzuarbeiten und die Datenqualität dauerhaft zu erhöhen.

Verantwortlichkeiten klären
Klare Verantwortlichkeiten für die Dateneingabe und Fehlerbereinigung in den Fachabteilungen, wie für das Unternehmen insgesamt, sind ein absolutes Muss.

Qualitätskriterien definieren
Die Anforderungen an die Datenqualität sind innerhalb einer Fachabteilung oder eines Unternehmens gemeinsam zu definieren und schriftlich, z.B. in Erfassungsrichtlinien festzuhalten.

Datenzustand analysieren
Der aktuelle Zustand der Daten ist zu prüfen und den Erfassungsrichtlinien gegenüberzustellen. Daten, die nicht den Erfassungsrichtlinien entsprechen, sind einmalig zu korrigieren.
Die Werkzeuge im Leitfaden können dabei helfen, müssen aber evtl. noch auf die eigenen Bedürfnisse angepasst werden.

Archivieren
In heutigen Datenbanken sind häufig Spalten oder Tabellen veraltet resp. werden nicht mehr benötigt. Diese Objekte machen die Datenbank / Tabellen nicht nur unübersichtlich, sondern haben auch Einfluss auf die Performanz. Aus diesen Gründen sollte ein Unternehmen periodisch prüfen, ob im Tagesgeschäft nicht mehr benötigte Daten archiviert oder gar gelöscht werden können.

Datenfluss automatisieren
Mit Hilfe von klar definierten Workflows (z.B. mit Flussdiagrammen) lassen sich Daten aus verschiedenen Abteilungen und von unterschiedlichen Knowhow-Trägern zusammentragen oder sogar automatisieren. Ziel ist, das Potential der vorhandenen Daten durch das Zusammenführen optimal zu Nutzen.
Im Sinne von Datenfluss ist nicht nur das Erfassen von neuen Daten, sondern auch die Dokumentation von gelöschten Daten (Historisierung) zu verstehen.

Mitarbeiter schulen
Datenqualität lässt sich nicht ausschliesslich mit technischen Mitteln erreichen. Dazu gehört z.B. die Vorgabe für einheitliche Schreibweisen (Strasse, Straße, Str., …). Damit solche Festlegungen in der Hektik des Tagesgeschäfts nicht untergehen, sollten Mitarbeiter in festen Zeitabständen erinnert oder geschult werden. Schulungen erhöhen auch das Bewusstsein bei den Mitarbeitern für die Bedeutung der Datenqualität.

Regelmässige Datenqualitätsprüfungen etablieren
Qualitätskontrollen und Datenbereinigungen müssen in regelmässigen, fix terminierten Abständen wiederholt werden. Die Periodizität solcher Kontrollen / Prüfungen ist von verschiedenen Faktoren abhängig (z.B. vom Aktualisierungsgrad der Daten). Unterstützung bieten u.a. die Werkzeuge, welche im Leitfaden aufgelistet sind. Mit diesem Vorgehen sollen unvollständige, fehlerhafte und redundante Daten oder Widersprüche in den Datenbeständen rasch aufgedeckt werden.