Nejužitečnější API s daty o COVID-19

Vše v jednom, historická a krajská data🔗

  • Historická data: počty případů, počty testů, počty smrtí, hospitalizace, karantény, reprodukční číslo.
  • Vývoj v krajích: karantény, úmrtí, případy dle okresů (detailnější, neboť MZČR publikuje pouze kraje).

Odkaz na API ~ nebo zkopírujte níže 📋

Více informací: zdroj dat, schéma dat, zdrojový kód

Zdroj dat

  1. MZČR
  2. ČSSZ
  3. Czech R0 Estimate, autoři: Jan Netík, Honza Řasa, Jan Schubert
  4. COVID-19 po okresech z KHS, autor: Marek Lutonský

Aktuální velikost dat

Schéma dat

Schedule

Každých 8 hodin

Zdrojový kód

Zdrojové kódy k nalezení na: github.com/h0n24/covid-czech-historical-data

Další API s daty o COVID-19

Nákaza v jednotlivých okresech podle krajských hygienických stanic🔗

Odkaz na API ~ nebo zkopírujte níže 📋

Více informací: zdroj dat, schéma dat

Zdroj dat

Zdrojem dat je Google Tabulka COVID-19 po okresech, KHS, kterou a spravuje Marek Lutonský, část dat je aktualizována pomocí crawleru Vladimíra Smitky a dalších (také jsem částí kódu přispěl :)).

Aktuální velikost dat

Schéma dat

Pozor! Data jsou oproti API se všemi daty, viz výše, řazena chronologicky, podle jednotlivých dnů. To je snazší na programové procházení, ale velikost zdrojových dat API může být větší než u verze výše.

Schéma dat

Přehled osob dle krajských hygienických stanic🔗

Odkaz na API ~ nebo zkopírujte níže 📋

Více informací: zdroj dat, schéma dat, motivace, zdrojový kód

Zdroj dat

Zdrojem dat je Přehled osob s prokázanou nákazou dle hlášení krajských hygienických stanic

Proč vznik další API? Problém s původní.

Velikost

API od ministerstva je zbytečně velká (Aktuálně: vs ), protože spousta dat se opakuje (měřeno pro minifikovanou druhou verzi, u první je rozdíl dat více než 30×). To může být časem, u většího počtu identifikovaných osob, značný problém.

Nečitelná data

Dalším problémem je fakt, že některá data jsou uchována v lidmi nečitelném formátu.

  • Identifikátor kraje je formátován podle klasifikace NUTS 3, ve kterém byla pozitivní nákaza hlášena krajskou hygienickou stanicí.
  • Identifikátor státu v zahraničí, kde došlo k nákaze je dvoumístný kód z číselníku zemí CZEM.

I přes tyto zkratky jsou zdrojová data mnohem větší (https://onemocneni-aktualne.mzcr.cz/api/v1/covid-19/osoby.json) než tato API.

Schéma dat

Ukázka dat

Schéma API

klíč vysvětlivka
data Viz níže – schéma dat
lastUpdatedAtSource Poslední update v původní api.
lastUpdatedAtApify Poslední update v API od Apify.

Schéma dat

den záznamu data ke dni pro každou osobu ve formátu:
[věk, pohlaví, místo nákazy, kraj]
2020-02-29 [25,"žena","Itálie","Ústecký kraj"],
[49,"žena","Spojené státy","Hlavní město Praha"],
[11,"žena","Česko","Ústecký kraj"]

Schedule

Každých 30 minut

Zdrojový kód

Více viz https://apify.com/sablatura/covid-hygiena-osoby

Vývoj reprodukčního čísla v ČR🔗

Odkaz na API ~ nebo zkopírujte níže 📋

Více informací: zdroj dat, schéma dat, motivace, zdrojový kód

Zdroj dat

Zdrojem dat je Google Tabulka COVID-19 Reproduction number estimate, kterou vytvořil tým lidí okolo Data Proti Covid, konkrétně Honza Řasa, Jan Schubert a Jan Netík. R0 se počítá z posledního týdne, více viz jednotlivá data. Zdrojové kódy lze nalézt na Githubu.

Aktuální velikost dat

Schéma dat

Ukázka dat

Schéma API

klíč vysvětlivka
data Viz níže – schéma dat
lastUpdatedAtSource Poslední update v původní tabulce.
lastUpdatedAtApify Poslední update v API od Apify.

Schéma dat

Ukázka dat:
["2020-03-16",2.3,2.5,2.8]

Vysvětlivky
date
Den pro který je R0 vypočítáno
CI_low
Spodní mez R0/7
R0_last7
Hodnota R0 za poslední týden
CI_high
Horní mez R0/7
"2020-03-16" 2.3 2.5 2.8

Zdrojový kód

Více viz https://apify.com/sablatura/covid-r0-czech

Data v Google DocsZpátky na informace o COVID-19