Żebyśmy się dobrze zrozumieli – metadane (część 2)

Wykorzystane bazy danych: CEIC, Passport GMID, World DataBank

W poprzednim odcinku obiecałem, że przyjrzymy się innym bazom statystycznym pod kątem metadanych i słowa dotrzymuję. Tym razem zajrzymy do baz Passport GMID, CEIC Data oraz World DataBank. Każda z nich prezentuje metadane nieco inaczej, ale każda traktuje ten temat poważnie. I nic dziwnego – w końcu to poważne źródła, którym zależy na wiarygodności, a bez podania metodologii nie mogłoby być o tym mowy.

Zaczniemy od bazy Passport GMID. Jej twórcy nie ustają w wysiłkach, aby ciągle zmieniać jej wygląd i dodawać nowe funkcjonalności. Ostatnio zmieniła się nieco strona główna i teraz do danych rynkowych bądź makroekonomicznych możemy dostać się na dwa sposoby. Albo skorzystamy z domyślnie wybranej sekcji Categories and Topics i klikniemy przycisk GO w jasnoniebieskiej ramce (jak na obrazku poniżej), albo rozwiniemy menu u góry ekranu wybierając Industries lub Economies.

Kiedy znajdziemy się już na etapie wyboru wskaźników, przy każdym z nich zauważymy charakterystyczny symbol z literką „i”. Jeden klik i otrzymamy informację, jakiego rodzaju danych możemy się spodziewać. Poniżej przykład z sekcji Alcoholic drinks.

Tak samo łatwo przekonamy się, co konkretnie oznaczają wskaźniki z innych sekcji. Weźmy na przykład taki Corruption Perceptions Index (czyli indeks postrzegania korupcji). Bez informacji objaśniających, dane liczbowe byłyby tu niewiele warte. Bo właściwie co to znaczy, że indeks postrzegania korupcji dla jakiegoś kraju wynosi 4,7? Dopiero z metadanych dowiadujemy się jak ten indeks powstaje i jak czytać jego wartości.

Jeśli nie sprawdzimy objaśnień wskaźników przed uzyskaniem tabeli z wynikami, baza pozwala nam w każdej chwili nadrobić zaległości, wystarczy zjechać na dół tabeli i kliknąć na Category Definitions.

Przyjrzyjmy się teraz bazie CEIC Data. Wchodzimy jako goście (guest access, chyba że ktoś ma założone konto, wtedy może się zalogować). Spośród szeregu podbaz proponuję wybrać największą z nich czyli Global Database.  Klikamy w plusik przy dowolnym kraju i rozwijamy interesującą nas kategorię.

Kiedy zejdziemy do ostatniego dostępnego poziomu szczegółowości, będziemy mieć do dyspozycji dwa rodzaje metadanych. Aby je uaktywnić, należy najechać myszką na interesujący nas wskaźnik. Po lewej stronie widać symbol z literką „i”, co nieomylnie doprowadzi nas do informacji objaśniających. Po prawej z kolei znajduje się (między innymi) ikonka z biretem. Oznacza ona Open footnote czyli otwórz przypis, choć w tym przypadku „przypis” to lekkie niedopowiedzenie.

Kiedy bowiem zdecydujemy się ów przypis otworzyć, przekonamy się że to wyczerpująca informacja na temat pochodzenia danych, metodologii ich opracowania, a także ich znaczenia i zakresu czasowego. Naturalnie nie dla wszystkich wskaźników przypis będzie tak samo obszerny (PKB to jednak skomplikowana sprawa), ale za każdym razem możemy oczekiwać rzetelnego wyjaśnienia.

Natomiast kiedy zdecydujemy się kliknąć na symbol z literką „i”, wyskoczy nam takie okienko jak na obrazku poniżej. Co ciekawe, dokładnie ten sam efekt uzyskamy klikając po prostu na nazwę wskaźnika na liście.

Jak widać znajdziemy tu innego rodzaju informacje na temat wybranego wskaźnika. Przede wszystkim zorientujemy się z grubsza w wynikach, ale nie tylko. Wiele obszarów jest tutaj klikalnych i można sporo się dowiedzieć –  jak zawsze, zachęcam do samodzielnej eksploracji. Z tego poziomu możemy także eksportować dane. Ma to sens jeśli interesuje nas jeden konkretny wskaźnik,  natomiast kiedy chcemy porównać ich kilka, lepiej użyć zielonego plusa po prawej stronie (na liście wskaźników) i dodać co nam potrzeba do okna z prawej strony. Wtedy możemy wyeksportować do jednego pliku kilka lub nawet wszystkie z wybranych pozycji.

A jeśli chcemy zapoznać się bardziej kompleksowo z objaśnieniami wskaźników, to na stronie głównej bazy możemy wybrać zakładkę Footnotes i przeglądać ją w wygodny sposób wybierając najpierw kraj a potem interesującą kategorię tematyczną.

Zapraszam jeszcze do bazy World DataBank. To zbiór baz danych o ujednoliconym wyglądzie i sposobie działania, ale oczywiście różniących się treścią. Proponuję skorzystać z największej z nich, czyli World Development Indicators.

Zaznaczamy interesujące nas kraje i przechodzimy do działu Series, czyli do wskaźników. Mamy ich do wyboru (w chwili, kiedy powstaje ten wpis) 1553, jest zatem z czego wybierać. Przy każdym z nich znajdziemy symbol z literką „i”, otwierający nowe okno po kliknięciu, takie jak to na obrazku poniżej.

Wygodnym rozwiązaniem jest zapisanie sobie definicji i powrót do bazy. O metadane możemy upomnieć się także już po uzyskaniu tabeli z wynikami. Służy do tego przycisk Metadata znajdujący się obok przycisków uruchamiających prezentację danych w formie tabeli, wykresu lub mapy. Jak widać na przykładzie poniżej, metadane mogą dotyczyć zarówno krajów, jak i wskaźników, a także przypisów (o ile takie występują).

Dokładnie w ten sam sposób znajdziemy metadane w każdej innej bazie zebranej pod szyldem World DataBank.

Mam nadzieję, że udało mi się was przekonać, jak ważnym elementem każdej bazy statystycznej są dane objaśniające. Intuicja i domyślanie się znaczenia znalezionych liczb może niektórym wystarczyć, ale chyba jednak lepiej mieć pewność.

Wszystkiego dobrego w nowym roku!