Wochennotiz Nr. 183

14.1. – 20.1.2014

kenyaWie viele Tiles sind das? [1]

Talk, Forum, Wiki & Blog

Open Data & ODbL

Humanitarian OpenStreetMap Team

  • HOT bittet alle, die während des Taifuns Haiyan (Yolanda) auf den Philippinen mit unbemannten Luftfahrzeugen (UAV) Luftbilder gemacht haben, diese freizugeben.

Konferenzen

  • Auf der FOSSGIS 2014 gibt es Zeit und Platz für Anwendertreffen, Code-Sprints und BOFs. Siehe dazu die Liste im FOSSGIS-Wiki. (via FOSSGIS-talk)

Karten

#switch2osm

Kennst du schon …

Programme

  • Die Entwickler der alternativen Android-Custom-ROM OmniROM wollen die propietäre Telefonwähl-App, die Google-Karten enthält, als Open-Source App nachbauen und OSM-Karten nutzen. (via Forum). Ein Fall für den Wettbewerbskommissar?
  • Die New York Public Library Labs haben mit map-vectorizer ein Programm veröffentlicht, das alte Handrisse (Vermessungszeichnungen) vektorisiert. Der Quellcode ist auf Github verfügbar. (via @scruss)

Weltweit

und sonst

In eigener Sache

  • Du interessierst dich für Neuigkeiten rund um OSM, verfolgst ein oder mehrere Kommunikationskanäle (Mailinglisten, Foren, help.openstreetmap.org usw.)? Dann bist du richtig! Die Redaktion der Wochennotiz sucht Unterstützung, damit die Wochennotiz nicht mehr eine Woche später, sondern schon mittwochs oder donnerstags erscheint.

Wochennotiz Nr. 182

7.1. – 13.1.2014

kenyaJérôme Gagnon-Voyer visualisiert mit OSM (leider fehlt der Hinweis) [1]

Talk, Forum, Wiki & Blog

Open Data & ODbL

  • Gregers Petersen hat einen Mapproxy aufgesetzt, über den nicht-WMS-fähige Editoren wie iD und Potlatch 2 amtliche dänische Luftbilder nutzen können.
  • Ein WMS-Dienst der tasmanischen Stadt Launceston (Australien) darf für OSM verwendet werden.

Humanitarian OpenStreetMap Team

Konferenzen

  • Am 15. und 16. Februar 2014 findet in der Geofabrik in Karlsruhe wieder ein Hackweekend statt. (via Forum)
  • Die SotM 2014 findet vom 7. bis 9. November 2014 in Buenos Aires (Argentinien) statt.

Karten

  • [1] Jérôme Gagnon-Voyer visualisiert ethnische Gewalt in Kenia mit OSM. (via Google+)
  • Für OsmAnd sind Sonderkarten (OBF-Format)  verfügbar. Sie zeigen Schifffahrtszeichen und Läden, die Bitoin akzeptieren,

#switch2osm

  • Simon Poole regt sich über mangelnde Namensnennung von OSM auf, wenn OSM-Daten genutzt werden.

Tagging

  • Wie taggt man ein Kamelgrab?
  • Im Forum und auf talk-de wird über Highway Shields (Strassennummern) und eine Erweiterung des OSM-Datenschemas in API v0.7 diskutiert.

Programme

  • GeoGit, ein Versionskontrollsystem für Geodaten, unterstützt jetzt auch GeoJSON.
  • Die App Cycle Nav von Schwinn (für Android und iOS) nutzt OSM-Daten zur Routenberechnung.
  • Änderungen, die mit Kort getätigt werden, werden künftig über den Bot-User kort-to-osm in die OSM-Datenbank eingetragen.
  • Den in Java geschriebenen Router Graphhopper kann man auch auf einem Raspberry Pi betreiben.

und sonst

  • Bei Google Maps gab es Unterschiede zwischen der Datenbank für die Suche und der Karte. Wer nach dem Theodor-Heuss-Platz in Berlin suchte, sah auf der Karte „Adolf-Hitler-Platz“ stehen. Der Platz heißt aber schon seit Jahrzehnten Theodor-Heuss-Platz.

Wochenvorschau

  • Es gibt noch freie Plätze auf dem OSM-Hackweekend in Berlin am 25. und 26. Januar 2014 (inkl. Kennenlernabend am 24. Januar).

Wochennotiz Nr. 181

31.12.2013 – 6.1.2014

reitundwanderLetzte Änderung an Straßen [1]

Rückblick 2013, Ausblick 2014

  • User mcld fragt sich, worum sich die OSM-Community im Jahr 2014 im Vereinigten Königreich kümmern sollte.
  • Richard Weait fragt, wie OSM dieses Jahr seinen zehnten Geburtstag feiern wird.
  • [1] MapBox hat Visualisierungen zu den Edits an Straßen im Jahr 2013 in seinem OSM Data Report 2013 veröffentlicht.
  • Derick Rethans hat die Edits des Jahres 2013 visualisiert.
  • Simon Poole blickt zurück ins Jahr 2013 und voraus ins Jahr 2014.

Talk, Forum, Wiki & Blog

  • Das Abarbeiten der noch offenen OpenStreetBugs geht voran.
  • jotpe fragt auf talk-de, was mit den OSM-Daten passieren würde, wenn sich die OpenStreetMap-Foundation, Rechteinhaberin der OSM-Daten, auflösen würde.
  • Sollten Weihnachtsmärkte auf openstreetmap.org gerendert werden?
  • Sämtliche (bis auf eine Ausnahme) Änderungen an kommunalen Grenzen in Deutschland (insbesondere Eingemeindungen und Zusammennschlüsse), welche zum 01.01.2014 in Kraft getreten sind, wurden inzwischen in den OSM-Datenbestand eingepflegt. Siehe auch den dazu gehörigen Forums-Thread.
  • Serge Wroclawski bloggt darüber, warum die Welt OSM braucht.
  • Die Gemeindefusionen in der Schweiz zum 1. Januar 2014 sind in OSM eingetragen.
  • User poppei82 hat seine Wette über einen Kasten Kirner Landbier dunkel gewonnen. Er hatte am 7. Oktober 2013 gewettet, dass die deutsche OSM-Community es nicht schafft, bis zum Jahresende 2013 25 Prozent aller von keepright angezeigten „beinahe Verbindungen“ zu fixen.

Konferenzen

#switch2osm

  • Der Radroutenplaner Naviki der Stadt Köln nutzt für das Routing OSM-Daten. Für die Kartenanzeige kann man zwischen OSM, OpenCycleMap und Google wählen. (via Forum)

Programme

  • OpenLayers3-Demo mit einem digitalen Geländemodell
  • Kort kann jetzt in die OSM-Datenbank schreiben, noch laufen die Tests. (via @KortGame)
  • Mit Planetry.js kann man animierte Globen in Websites einbetten. (via @JavaScriptDaily)

und sonst

  • OpenSeaMap wird auf der Boot 2014 vom 18. bis 26. Januar 2014 in Düsseldorf vertreten sein (Halle 11, Stand H18), u.a. mit JOSM-Werkstatt zum Lernen und Mappen sowie NMEA-Logger-Verkauf.
  • Zwölf Leute aus der GIS-Branche blicken in ihre 2014er Kristallkugel.

Wochenvorschau

  • Am 16. Januar wird Jochen Topf an der Hafen City Universität Hamburg in der City Nord einen öffentlichen Vortrag zum Thema „Das OpenStreetMap-Datenmodell“ halten. (via talk-de)

In eigener Sache

  • Roland Olbricht geht in einem Blogpost im deutschen OpenStretMap-Blog auf die aktuellen Performance-Probleme der Overpass-API ein.

Wochennotiz Nr. 180

24. – 30.12.2013

reitundwanderDie Reit- und Wanderkarte übersetzt … [1]

Talk, Forum, Wiki & Blog

  • Steven Vance beschreibt seine Verbesserungen am Chicagoer Fahrradspuren-Netz in OSM.
  • Simon Poole bloggt über die Straßenlistenauswertung der Schweiz und die Veränderungen im Jahr 2013.
  • Wurde die Relation 3392653 nur angelegt, damit man mit der OSM-API eine Bahnstromkarte bekommt? Auf talk-de wird der missbräuchliche Verwendung von Relationen als Kategorien kritisiert.

Open Data & ODbL

  • Ein kritischer und ernüchternder Überblick über online verfügbare Geodaten deutscher Vermessungsverwaltungen.

Konferenzen

  • Wird OSM auf dem Augsburger Linux-Infotag am 22. März 2014 vertreten sein?

Karten

Kennst du schon …

Programme

Weltweit

20.000 Umdrehungen pro Minute

Overpass API logo 700px

Kurz vor Weihnachten hat die Overpass API einige Anfragen deutlich langsamer als gewohnt beantwortet. Das ist zwar recht bald wieder besser geworden. Aber seitdem verhält sich die Overpass API an einer anderen Stelle weniger schnell als gewohnt: Ist normalerweise der Datenstand nur 1-2 Minuten hinter der Hauptdatenbank, so ist er im Moment in den Abendstunden oft bis zu 30 Minuten hinter dem Datenstand der Hauptdatenbank.

Dies kann man am Wert „Lag to OSM Main Database“ hier ablesen.

Das erste Phänomen hängt allein mit Areas zusammen: Entgegen meinen Vermutungen auf Talk-De lag es nicht direkt an einer Fläche über den Südpol, sehr wohl aber an der neu erfassten Fläche für die Antarktis. Diese Fläche soll alles südlich des 60 Grades südlicher Breite umfassen. Das ist mal locker ein Sechstel der Koordinatenfläche in Längen-Breitengrad-Systematik und damit z. B. ein Vielfaches der bereits riesigen Fläche von Russland. Das war zu groß für die Software. Das Problem ist bis auf Weiteres dadurch gelöst, dass die Erzeugung sehr großer Flächen jetzt übersprungen werden. Es betrifft die Gesamtrelationen für Russland, Australien und eben mehrere Antarktis-Relationen. Damit kann dann auch ein wohlmeinender Mensch mit einer Eurasien- oder Pazifik-Relation nicht mehr die Datenbank sprengen.

Aber woher kommt der Rückstand zur Hauptdatenbank und wann wird das wieder besser? Zeit für Detektivarbeit!

Fangen wir mit dem Naheliegenden an: Gibt es mehr Andrang auf der Overpass API? Danach sieht es nicht aus. Die Anzahl unterschiedlicher IP-Adressen pro Tag ist seit September bei 4000 etwa gleich geblieben. Die Anzahl der Queries ist sogar gefallen, aber da Queries unterschiedlich groß sein können, muss das nichts heißen. Es kommt durchaus vor, dass Nutzer über 10.000 Objekte einzeln per Id abfragen – das macht kaum Last, erhöht aber stark den Query-Zähler.

Die übertragene Datenmenge ist andererseits gestiegen, aber erstens bei weitem nicht so stark, dass dies die Last erklären könnte, und vor allem passt die Verteilung kaum zu den Lastspitzen des Update-Prozesses.

Unser Detektiv würde sich also wohl eher anderen Verdächtigen zuwenden, aber die Leser mögen das Phänomen im Hinterkopf behalten.

Der nächste Verdächtige ist die Datenbank für die nächste Version der Overpass API. Diese wird zwei maßgebliche Verbesserungen bringen. Zum einen wird die auf der SoTM 2013 (korrigiertes Video) angesprochene Kombination aus großer Bounding-Box und Tag-Kriterium schneller, denn die Datei, die Tags auf Ids abbildet, merkt sich jetzt auch geographische Indizes. Zum anderen wird die Datenbank die volle Historie seit dem Lizenzwechsel bekommen, so dass man beispielsweise auch abfragen könnte, welche Briefkästen in Bonn im Dezember 2012 gemappt gewesen sind.

Das erfordert allerdings, mit einem Planet vom Lizenzwechsel zu starten und alle Diffs seitdem auf die Datenbank anzuwenden. Das durchzurechnen dauert etwa einen Monat und passiert seit dem 21. Dezember.

Eigentlich kann es die aktuelle Version nicht beeinträchtigen, da die neue Version mit ionice läuft. Ionice ist ein Werkzeug des Linux-Kernels, um die Festplatten-Priorität für einzelne Prozesse zu verändern. Die neue Datenbank wird mit so niedriger Priorität gerechnet, dass nur dann Zugriffe stattfinden sollten, wenn für die aktuelle Version nichts zu tun ist. Auf die gleiche Weise ist übrigens generell auch die Area-Erzeugung herunterpriorisiert.

Beides funktioniert sehr wirksam: Sowohl die Area-Erzeugung als auch die neue Datenbank werden weniger als halb so schnell bearbeitet, wenn die aktuelle Version mehr als eine Minute Verspätung sammelt. Anders ausgedrückt: die beiden Verdächtigen haben ein sehr gutes Alibi.

Zeit für einen ungewöhnlicheren Verdächtigen: die aktuelle Version bietet die sogenannten Augmented Diffs – Diffs, die alle Geometrie-Information explizit enthalten, damit man diese auch einzeln ohne Datenbank auswerten und darstellen kann. Die Diffs werden z. B. für Norbert Renners Achavi genutzt (laufende Instanz).

Die Erzeugung ist zwangsläufig mit den normalen Updates verzahnt, denn dabei stehen die benötigten Daten zur Geometrie ja genau zur Verfügung. Allerdings kann das trotzdem viel Zeit brauchen: Wenn nämlich ein Knoten einer großen Relation, z. B. der deutschen Grenze angefasst wird, ändert sich deren Geometrie. Und für den vollständigen Augmented Diff müssen dann die geometrischen Daten der ganzen deutschen Grenze gesammelt werden. Das kostet Zeit.

Tatsächlich spielt das eine Rolle, denn die Datenmengen pro Stunde Datenbank-Zeit (und nicht die Größe eines einzelnen Diffs, diese ist für einen mehrminütigen Diff sowieso größer als für einen einminütigen) sind in den Abendstunden tatsächlich spürbar größer. Allerdings gilt auch hier: Größen-Rekorde hat es im Dezember nicht gegeben, sondern in den Monaten vorher, in denen die Overpass API auch abends näher am Puls der Zeit war. Wir haben also einen Teil des Rätsels geklärt, nämlich warum speziell von 17 bis 24 Uhr sich die Verzögerungen häufen.

Übrigens wird dieses Problem mit der neuen Version besser: dann können Augmented Diffs bei Nachfrage erzeugt werden, was nicht nur beliebige Zeiträume (1 Sekunde ebenso wie mehrere Monate) erlauben wird, sondern eben das Problem, die Geometrie vollständig nachschlagen zu müssen, vom Update-Prozess entkoppelt.

Unauffällig dazugekommen ist auch eine andere Funktion: Die auf dem Export-Tab von osm.org seit neuestem erwähnte Map-Export-Funktion (mit der eigenwilligen Übersetzung „API überführen“ – hört sich an, als wenn da eine Maschine übersetzt hat. Kann man eigentlich Übersetzungen weniger aufwendig als mit einem Pull-Request beitragen?). Diese könnte eine hohe Last erklären, weil sie es leicht macht, große Datenmengen abzufragen. Andererseits verhindert ein eher aggressiver unumgänglicher 5-Minuten-Timeout, dass die Abfragen zu aufwendig werden.

Um die Last des Map-Aufrufs gesondert herauszufinden, habe ich das Logging erweitert: Laufzeiten abzufragen wäre kontraproduktiv, weil gleich aufwendige Abfragen ja langsamer laufen, wenn generell die Server-Last höher ist. Man findet dann nur neu heraus, was man schon vorher wusste. Die schlichte Anzahl der Abfragen hilft hier nicht, weil ja gerade der Verdacht besteht, dass spezielle Abfragen viel aufwendiger als die Durchschnittsabfrage sind.

Also zähle ich jetzt Plattenzugriffe. Da fast alle Plattenzugriffe der Overpass API einheitlich je 512K en bloc lesen, reicht zählen hier aus. Das hat eine große Überraschung gebracht.

Zu erwarten wären grundsätzlich etwa 8 Zugriffe pro Sekunde bzw. knapp 30.000 Plattenzugriffe pro Stunde, da die Festplatte ihren Lesekopf jeweils zum Anfang des Blocks bewegen muss. Die Messungen ergeben aber mehr als 1.2 Mio. Zugriffe pro Stunde (20.000 pro Minute), also das 40-fache! Dann spielt der Cache eine viel größere Rolle, als ich bisher immer vermutet habe. Der Cache ersetzt Festplattenzugriffe durch Abrufe vorhandener Kopien der gleichen Daten im RAM, was etwa um den Faktor 1000 schneller geht als ein Festplattenzugriff. Demnach kommen also wohl knapp 98% aller Blöcke statt von der Festplatte vom Cache. Das spricht sehr für die Qualität der Cache-Algorithmen im Linux-Kernel.

Entgegen der Erwartungen passt aber das Lastmuster bei den Plattenzugriffen nur äußerst schlecht zu den Lastspitzen der Update-Funktion. Das allein erklärt es also nicht.

Es hat mich aber auf eine andere Hypothese gebracht, und wie es sich für einen guten Krimi gehört, ist sie durchaus etwas verworren: Die Leistungsfähigkeit der Update-Funktion hängt maßgeblich davon ab, wie groß der Anteil der Datenbank ist, der im Cache statt nur auf der Festplatte liegt. Wenn nun die zweite Datenbank bearbeitet wird, belegt diese ebenfalls einen erheblichen Teil des Caches. Dazu kommt, dass die Map-Abfragen gerne viel RAM belegen. Das spielt alles eine untergeordnete Rolle, solange nicht für die Augmented Diffs große Datenmengen gewälzt werden müssen. Aber so machen sich die Augmented Diffs jetzt bemerkbar, während vorher der Cache die zusätzliche Last kaschiert hat.

Wenn die Erklärung richtig ist, wird sich die Lage entspannen, wenn die neue Version aktiv wird. Diese braucht ja weniger Last für die Augmented Diffs. So sehe ich also gespannt dem Moment voraussichtlich Ende Januar entgegen, wenn die Datenbank für neue Version auf die aktuelle Zeit aufgeholt hat.

Wochennotiz Nr. 179

17. – 23.12.2013

screenshotMit Hoursome auf iOS nach geöffneten POIs suchen … [1]

Talk, Forum, Wiki & Blog

  • User ubahnverleih meint, dass die Weihnachtszeit eine Mappingzeit sei.
  • User Toliman fragt, wie man die Länge eines Ways berechnen kann.
  • Pascal Neis regt sich über den Missbrauch von Notes auf osm.org für Mapping-Notizen auf.
  • User Wuzzy2 fragt: Sollten auf openstreetmap.org nur Layer angeboten werden, die vollkommen frei sind (Lizenz der Kacheln, Offenheit und Lizenz des Rendering-Stylesheets)?
  • SK53 bloggt über den möglichen Nutzen von OSM für Freeride-Skifahren (Skifahren abseits von Pisten).
  • User a_peter erklärt, wie man mit der Overpass-API bestimmte Daten (z. B. Restaurants) innerhalb einer Grenzrelation findet.

Open Data & ODbL

openstreetmap.de

  • Peter beendet seine Moderatorentätigkeit bei RadioOSM.

Konferenzen

Kennst du schon …

Programme

  • [1] User MorbZ hat mit Hoursome eine iOS-App veröffentlicht, die Öffnungszeiten auswertet. (via Forum)
  • Die neue JOSM-Version 6502 enthält viele Änderungen. Windows-Nutzer sollten langsam daran denken, von Java Version 6 auf Version 7 umzusteigen.

und sonst

Wochenvorschau

In eigener Sache

Das Wochennotiz-Team wünscht allen Lesern auch im neuen Jahr viel Spaß beim Mappen und Nutzen von OSM-Daten.