Dublettenerkennung mit reDUB > Glossar Geocoding

Geocoding

Beim Geocoding, häufig auch Geotagging oder Geomapping genannt, werden Daten auf digitalen Landkarten dargestellt. Diese Daten können z.B. Kundendaten, Umsatz- oder Absatzzahlen sein. Durch die grafische Abbildung auf digitalen Landkarten werden Ergebnisse und Zusammenhänge leichter verständlich und interpretierbarer als in Tabellenform und können dadurch auch besser analysiert werden. Diese Visualisierung wird oftmals durch die Verknüpfung oder Anreicherung mit Zusatzdaten erweitert, so dass man daraus umfangreiche geografische Analysen erstellt werden können und Handlungsschwerpunkte deutlich gemacht werden. Auf diese Weise wird durch Geocoding beispielsweise die Planung bei zukünftigen Marketingaktionen erleichtert.

Als Basis wird beim Geocoding für jeden Adressdatensatz eine straßenabschnittsgenaue Koordinate errechnet, die sich aus den beiden Werten „Breitengrad“ und „Längengrad“ zusammensetzt (diese beiden Koordinaten können entweder als Kommazahl oder im sog. „UTM-Format“ vorliegen). Mit Hilfe dieser Koordinaten bzw. Geocodes/Geotags können ein oder mehrere Adressdatensätze auf einer Landkarte angezeigt werden, so dass daraus optisch z.B. hervorgeht, aus welcher Region die meisten Kunden des eigenen Unternehmens stammen.

Diese Adressdaten werden aussagekräftiger, wenn die Geocodes durch weitere Werte aus der Datenbank, wie z.B. Umsatzzahlen oder Altersdurchschnitt, angereichert werden. Häufig sind Geocoding-Programme in der Lage, z.B. durch Flächenfärbung bestimmte Verteilungen auf der Landkarte darzustellen. Auf diese Weise lassen sich z.B. die umsatzstärksten Gebiete ablesen oder in welcher Region beispielsweise die im Durchschnitt jüngsten oder ältesten Kunden wohnhaft sind.

Beispielhafte Vorgehensweise beim Geokodieren von Adressen: Zunächst müssen alle Adressen in eine entsprechende Datenbank importiert werden, sofern sie noch nicht in dieser Form vorliegen. Im zweiten Schritt gibt man der Geocoding-Software bekannt, in welchem Datenbank-Feld sich welches Adressfeld (wie „Straße“, „Hausnummer“, „PLZ“, „Ort“, „LKZ“ usw.) befinden. Die Geocoding-Software durchläuft anschließend sämtliche Adressdatensätze aus der Datenbank und setzt bei jedem eindeutigen Treffer für den entsprechenden Datensatz die Breiten-Koordinate und die Längengrad-Koordinate. In der Datenbank sind z.B. die Felder „LATITUDE“ und „LONGITUDE“ vom Datentyp „Kommazahl“ vorgesehen, welche diese Werte aufnehmen. In einem weiteren Feld wird der sog. „Status“ hinterlegt, der z.B. angibt, ob die Adresse von der Geocoding-Software eindeutig, mehrfach oder ggf. überhaupt nicht gefunden werden konnte. Häufig wird von vielen Geocoding-Programmen noch eine manuelle Nachbearbeitung angeboten, mit der alle Adressen, die nicht eindeutig geokodiert werden konnten, „von Hand“ gesetzt werden können. Hier gibt es oftmals die Möglichkeit, den richtigen Treffer bzw. die richtige Geokoordinate aus einer Vorschlagsliste auszuwählen (falls für die Adresse mehrere Treffer gefunden wurden), die Koordinaten selbst einzutragen oder die Adresse z.B. auf einem „PLZ-Schwerpunkt“ zu setzen (in diesem Fall wird der geografische Mittelpunkt eines PLZ-Bereiches als Koordinate gesetzt).

An zwei Beispielen sollen die Einsatzmöglichkeiten von Geocoding genauer demonstriert werden. Für beide Beispiele wird im Vorfeld wie oben beschrieben jeder einzelne Datensatz aus der Datenbank geokodiert und somit mit einer Breitengrad-Koordinate und Längengrad-Koordinate versehen.

„Umkreissuche“: Die Umkreissuche wird dazu verwendet, um z.B. alle Kunden im Umkreis von 50 Kilometern des Firmensitzes zu ermitteln. Als Mittelpunkt für diese Umkreissuche wird also die Koordinate des Firmensitzes festgelegt. Nun werden sämtliche Kundendatensätze durchlaufen und für jeden Datensatz die Entfernung berechnet. Ist die Entfernung zwischen Kundendatensatz und Firmensitz in unserem Fall kleiner oder gleich 50 Kilometer, wird der Datensatz als Treffer markiert. Sieht man sich das Ergebnis im Anschluss auf der Landkarte an, sieht man im Idealfall den Kundensitz in der Mitte markiert und kreisförmig um den Mittelpunkt sämtliche Kunden verteilt.

„Filialsuche“: Diese Einsatzform des Geocodings ist vielen Anwendern von zahlreichen Firmenwebseiten bekannt – es kommt nämlich immer dann zum Einsatz, wenn man z.B. als Kunde die nächstgelegene Filiale sucht. Bei einer Filialsuche über die gesamte Datenbank werden die Koordinaten von jeder Filiale mit den Koordinaten von jedem Kunden abgeglichen und die Entfernung berechnet. Die Übereinstimmung mit der geringsten Entfernung gibt dann auch die zum Kunden nächstgelegene Filiale wieder. Im Anschluss lässt man sich das Ergebnis am besten wieder direkt auf der Landkarte anzeigen, um eine optische Übersicht zu erhalten.

Beispiele für Programme, die Koordinaten anhand der Adressfelder berechnen können und somit für Geocoding eingesetzt werden können:

  • „Microsoft MapPoint“: Geocoding-Lösung von „Microsoft“, muss auf dem eigenen Rechner installiert werden, kostenpflichtig.
  • „Google Maps“: Geocoding-Dienst von „Google Inc.“, Online-Lösung, bei der Geokodierung von größeren Adressmengen kostenpflichtig.
  • „OpenStreetMap“: Geocoding-Projekt unter der „Creative-Commons-Attribution-ShareAlike-2.0“-Lizenz, Online-Lösung, kostenlos.