Przestrzenne dane demograficzne Wrocławia
Prezentuję nowy cykl – Dane po Wrocławsku – w którym będę publikować zbiory danych przydatne do analiz zjawisk dziejących się we Wrocławiu. Często przy zetknięciu z popularnymi wykresami lub infografikami dot. zjawisk w zachodnich miastach myślę sobie, co gdyby te same badania/zjawiska sprawdzić dla Wrocławia? Cykl ten ma służyć wrocławskim analitykom danych i nie tylko, by mogli w łatwy sposób, w jednym miejscu znaleźć najważniejsze dane dotyczące miasta, jak również by mogli tutaj publikować wyniki swoich prac.
Jeśli jesteś tu tylko po dane, znajdziesz je w CartoDB oraz Research Gate – DOI: 10.13140/RG.2.1.3848.2967·
Dane po Wrocławsku
Do robienia analizy miejskich potrzebne jest przygotowanie pewnego warsztatu, a w szczególności danych, czasem będą to dane bezpośrednio ze świetnej inicjatywy OpenData okraszone szerszym opisem i przykładami użycia, innym razem będę udostępniał te dane w postaci przetworzonego zbioru danych — np. kiedy wymagał on chwili pracy nad integracją pomiędzy systemami różnych instytucji (np. wrocławskiego SIP-u i danych z GUS-u).
Na samym początku chcę opowiedzieć i zgromadzić dla wrocławskich (i nie tylko) data scientists dane, które często są potrzebne do analiz. Będę je udostępniać w łatwych do załadowania i przetwarzania formatach. Najczęściej będę je umieszczał na ogólnodostępnych platformy jak np. cartodb.com lub inne platformy jeśli akurat będą oferować sensowną wartość dodaną. Przetworzonym zbiorom danych będą towarzyszyć noty publikacyjne z ResearchGate, które posiadają unikatowy numer identyfikacyjny (DOI) dzięki czemu można go w prosty i szybki sposób cytować w pracach naukowych.
Chcę docelowo zgromadzić następujący bazowy zestaw danych:
- dane demograficzne z podziałem na wiek oraz obszarami wedle rejonów statystycznych
- pełne dane o możliwościach ruchu w mieście, tj. złączone ze sobą dane o trasach pieszych, rowerowych i samochodowych z openstreemapy (wysoka jakość we Wrocławiu) połączone z danymi z GTFS udostępnionymi z OpenData, a także ruchu kolejowego (jeśli się uda)
- dendryty i obciążenia ruchem — uzyskane za pomocą systemu pankus autorstwa Macieja Kamińskiego oraz prof. T. Zipsera z Katedry Planowania Przestrzennego
- szczególnie poszukuję danych o mobilności pasażerów, korkach i wszelkiej maści podobnych rzeczach, jeśli macie takie dane — piszcie na niedakh@gmail.com
- jestem również otwarty na propozycje, a także na nadsyłanie danych – serdecznie zachęcam wszystkich do dzielenia się danymi
Cykl zaczynam od danych demograficznych.
Dane demograficzne
Bardzo często istnieje potrzeba zestawienia jakiegoś zjawiska we Wrocławiu z danymi o tym, ilu ludzi mieszka na danym obszarze. Dane demograficzne można pobrać z systemu informacji przestrzennej Wrocławia — mapy demograficznej.
Znajdziemy tam 579 obszarów, do każdego przypisana populacja z podziałem na wiek. Można te dane dość łatwo zaznaczyć, ułożyć w tabelę i wyeksportować jako CSV. Niestety, nie da się wyeksportować w wygodny sposób danych geograficznych o obszarach. Znamy jedynie numery rejonów statystycznych GUS do których są przyporządkowane. Rejony statystyczne pochodzą z systemu BREC rejestru TERYT zebranego przez GUS. Ostatni raz system ten był aktualizowany w 2011 roku.
Dane z systemu BREC dostępne są przez portal realizujący europejską dyrektywę INSPIRE dot. danych GIS. Link do archiwum ZIP zawierającym shapefiles (SHP) z rejonami statystycznymi systemu BREC w projekcji EPSG:2180 znajdziecie tutaj.
Naszym celem w tym odcinku jest posiadanie jednolitego zbioru zawierającego zarówno obszary jak i dane demograficzne. Taki zbiór danych, w projekcji EPSG:4326 udostępniam w serwisie CartoDB jak również w postaci noty publikacyjnej w portalu Research Gate: DOI: 10.13140/RG.2.1.3848.2967·
- nr rejonu statystycznego
- liczbę zameldowanych osób w tym rejonie
- gęstość zaludnienia w tym rejonie
- liczbę zameldowanych osób w tym rejonie w podziale wedle wieku: 0–2, 3–6, 7–12, 13–15, 16–18, 19–24, 25–34, 35–44, (45–59 dla kobiet / 45–64 dla mężczyzn), (od 60 dla kobiet / 65 dla mężczyzn do 79) i od 80 lat w górę
- zapisany w formie WKT obszar geograficzny tego rejonu — wielokąt (POLYGON) w projekcji EPSG:4326 najpopularniejszej w globalnych narzędziach mapowych w sieci
Gorąco zachęcam do korzystania, kopiowania i bawienia się tym jakże długo oczekiwanym zbiorem danych!
Zbiór danych można cytować w następujący sposób:
Szymański P., „Wrocław demography per BREC statistical region of the city”, ResearchGate, 25 stycznia 2016 [dostęp: dzień miesiąc rok], <http://dx.doi.org/10.13140/RG.2.1.3848.2967>, DOI: 10.13140/RG.2.1.3848.2967.
lub za pomocą narzędzia bibtex:
@misc{10.13140/RG.2.1.3848.2967, author = {Piotr Szymański}, title = {Wrocław demography per BREC statistical region of the city}, doi = {10.13140/RG.2.1.3848.2967}, howpublished= {\url{http://dx.doi.org/10.13140/RG.2.1.3848.2967} }
Na apetyt, wizualizacja liczby zameldowanych we Wrocławiu, z rejonami pogrupowanymi wedle gęstości zaludnienia metodą Jenksa:
WOW! super!