Wszystkie wpisy, których autorem jest Wojciech Myszka

Dane, dane, dane…

…gdzie są te dane!

Nie chcąc zbyt wiele pisać na ten temat podepnę wpis z portalu Smarter Poland (poświęconego różnycm ciekawym sposobom przetwarzania danych). Opiekunem portalu jest Przemysłąw Biecek (absolwent Politechniki Wrocłąwskiej), z którym miałem przyjemność kiedyś się spotkać…

Rząd Polski publikuje dane na temat rozwoju pandemi w postaci wpisów twitterowych, bardzo chętnie umieszczając tam infografiki zawierające różne pożyteczne informacje (o liczbie zajętych respiratorów, na przykład). Oczywiście, można zapytać cóż w tym złego? Niby nic, ale taki Rząd Włoski poblikuje dane na githubie: Presidenza del Consiglio dei Ministri – Dipartimento della Protezione Civile. Czyli można inaczej.

W Polsce wszyscy podniecają się, że dane takie ręcznie zbiera i publikuje jako arkusz kalkulacjny Google nastolatek z Torunia. Z danych tych korzystają praktycznie wszystkie zespoły naukowe chcące dokonywać jakichś prognoz.

Na koniec zobaczmy co pisze Przemysłąw Biecek:

Dlaczego dostępność dobrej jakości danych jest taka ważna?

Brak dobrej jakości danych paraliżuje prace niezliczonej ilości podmiotów. Począwszy od modelarzy, którzy miesiącami opracowują modele predykcyjne dla możliwych scenariuszy pandemii, przez właścicieli małych biznesów, którzy nie wiedząc jak wygląda sytuacja nie mogą efektywnie planować swojej pracy, po szeregowych obywateli, którzy po prostu chcą wiedzieć co się dzieje. Bardzo chcą wiedzieć, więc jeżeli nie będzie oficjalnych rzetelnych danych to tworzy się przestrzeń dla fakenewsów.

(Za serwisem SmarterPoland.pl)

Ach! Te procenty

Na konferencji prasowej, która odbyła się 8 października, Premier RP powiedział, że o 30% wzrosłą liczba nowych przypadków w stosunku do liczby podanej dnia poprzedniego.

Szybkie sprawdzenie pozwoliło stwierdzić, że 7 października Ministerstwo Zdrowia zaraportowało 3003 przypadki, natomiast 8 października podało 4280 przypadków. Na pierwszy „rzut oka” wzrosło nam o 1200 przypadków, czyli około 40% w stosunku do stanu poprzedniego.

Można też powiedzieć, że 7 października mieliśmy 30% mniej przypadków niż 8 października, ale nie znaczy to że wzrosło o 30 procent.

A myślałem, że Pan Premier kiedyś pracował w banku i z procentami jest trochę obeznany…

Dowody na istnienie kosmitów

Ostatnio ogromne zainteresowanie mediów i naukowców wywołała praca Phosphine gas in the cloud decks of Venus. Najprostszy wniosek z niej wypływający jest taki: Na Wenus jest życie! Pewne komentarze pojawiły się również na naszej stronie głównej.

W dowcipny sposób skomentowano to na stronach xkcd

Dowody na życie na Wenus

Tłumaczy on, w pewnym stopniu, jak należy traktować różne doniesienia i jakie z nich wyciągać wnioski. Obszerne wytłumaczenie, jak zwykle, na serwisie Explain XKCD.

Jak wyciągnąć dane z wykresu

Dzisiejsze, poranne przeglądanie Internetu doprowadziło do ciekawego znaleziska. Rozpocząłem od komiksowej strony xkcd.

Później zajrzałem do wiki wyjaśniającej Co Autor chciał powiedzieć? Choć to akurat wydawało się dosyć oczywiste — podczas analizy danych całkiem często mamy do czynienia nie tyle z cyfrowym zestawem danych, ile z ich zobrazowaniem w postaci wykresu.

A tam znalazłem odniesienie do aplikacji pozwaljącej czytsć dane z wykresu: WebPlotDigitizer.

Po obejrzeniu tutoriali uważam, że obok aplikacji tabula (pozwalającej wyciągać dane z tabel PDF) jest warta zapamiętania.