…gdzie są te dane!
Nie chcąc zbyt wiele pisać na ten temat podepnę wpis z portalu Smarter Poland (poświęconego różnycm ciekawym sposobom przetwarzania danych). Opiekunem portalu jest Przemysłąw Biecek (absolwent Politechniki Wrocłąwskiej), z którym miałem przyjemność kiedyś się spotkać…
Rząd Polski publikuje dane na temat rozwoju pandemi w postaci wpisów twitterowych, bardzo chętnie umieszczając tam infografiki zawierające różne pożyteczne informacje (o liczbie zajętych respiratorów, na przykład). Oczywiście, można zapytać cóż w tym złego? Niby nic, ale taki Rząd Włoski poblikuje dane na githubie: Presidenza del Consiglio dei Ministri – Dipartimento della Protezione Civile. Czyli można inaczej.
W Polsce wszyscy podniecają się, że dane takie ręcznie zbiera i publikuje jako arkusz kalkulacjny Google nastolatek z Torunia. Z danych tych korzystają praktycznie wszystkie zespoły naukowe chcące dokonywać jakichś prognoz.
Na koniec zobaczmy co pisze Przemysłąw Biecek:
Dlaczego dostępność dobrej jakości danych jest taka ważna?
Brak dobrej jakości danych paraliżuje prace niezliczonej ilości podmiotów. Począwszy od modelarzy, którzy miesiącami opracowują modele predykcyjne dla możliwych scenariuszy pandemii, przez właścicieli małych biznesów, którzy nie wiedząc jak wygląda sytuacja nie mogą efektywnie planować swojej pracy, po szeregowych obywateli, którzy po prostu chcą wiedzieć co się dzieje. Bardzo chcą wiedzieć, więc jeżeli nie będzie oficjalnych rzetelnych danych to tworzy się przestrzeń dla fakenewsów.