pondělí 25. září 2017

Všechna státní data jako otevřená (Open data)

Příznivci otevřených dat, oslavujte a radujte se. V pátek 22.9.2017 nám přišel k připomínkám níže uvedený návrh usnesení vlády ČR  "o zveřejňování dat, která jsou vedena v informačních systémech veřejné správy spravovaných ústředními správními úřady, jako otevřených dat".


Tento návrh zjednodušeně řečeno říká, že všechna neprovozní data vedená v IS státní správy by měla být zpřístupněna jako otevřená data, pokud tomu nebrání nějaké jiné právní předpisy. Týká se to dat, které jsou vedena v IS, které budou vytvořeny nebo rozvíjeny a využitím zákona o zadávání veřejných zakázek. Zjednodušeně řečeno, pokud budeme po 1.1.2018 dělat veřejnou zakázku (VZ) na nový systém nebo na podporu stávajícího, tak už s tím  musí počítat.

Záměr je to podle mě velmi dobrý a chvályhodný a směřuje k tomu, aby se na otevřená data myslelo při vypisování nových VZ, což je správná cesta. Bohužel ale dojem z tohoto záměru velmi kazí fakt, že pro jeho připomínky se použila zkrácena lhůta, konkrétně je musíme odeslat do 29.9.2017. Reálně na připomínky máme 3 dny, protože 28.9.2017 je státní svátek a většina lidí má na 29.9.2017 naplánovanou dovolenou, takže je musíme dát dohromady do 27.9.2017, tj. 3 dny, přičemž otázek a nejasností v dané problematice je spousta.

Na první pohled to vypadá, že není  žádný problém. Ale když jsme se rychle trochu zamysleli nad možnými dopady na nás, tak jsme zjistili, že vlastně ani přesně nevíme, co vše pod otevřená data spadá.  Podle  §3 odstavce (11) zákona o svobodném přístupu k informacím 106/1999 Sb. je definice otevřených dat následující:
"Otevřenými daty se pro účely tohoto zákona rozumí informace zveřejňované způsobem umožňujícím dálkový přístup v otevřeném a strojově čitelném formátu, jejichž způsob ani účel následného využití není omezen a které jsou evidovány v národním katalogu otevřených dat".

Pokud by se někdo zaradoval, že všechny úřady budou muset zveřejnit například i data z personálních systémů, tak ho rovnou zklamu, protože tato povinnost se naštěstí (jinak bychom se z toho asi zbláznili) nevztahuje na provozní systémy, které jsou definovány takto:
"Provozní informační systém - informační systém zajišťující informační činnosti nutné pro vnitřní 
provoz příslušného orgánu, například účetnictví, správu majetku, nesouvisející bezprostředně 
s výkonem veřejné správy – viz § 2 písm. u) zákona o ISVS."

Uvedu pár okruhů a otázek, které mě napadly při prvním přemýšlení. Jedním z okruhů je například náš výměnný formát ISKN (NVF), který obsahuje prakticky všechna data ISKN. Je strojově čitelný a je dokumentovaný. Dnes je ale placený, není dostupný online dálkovým přístupem, není veřejný a obsahuje osobní údaje. Stačí tedy, pokud ho zveřejníme dálkovým způsobem?

1) Veřejný = zdarma?
Pokud stačí jeho zveřejnění, může být placený, nebo musí být poskytován zdarma? Pokud zdarma, tak co se stane našimi příjmy, které musíme povinně odvádět do státního rozpočtu? Není to zrovna malá částka (pozn. možná to nevíte, ale i když jsme státní správa, tak máme nařízenu splnit určitou velikost příjmů, kterou musíme odvést do státního rozpočtu, na kterou jsou vázány naše výdaje a když ji nesplníme, tak máme docela problém).

2) Osobní údaje 
Co s osobními  údaji, které ve výměnném formátu jsou?
Máme je z něj nějak vyřezávat, kvůli GDPR?  Když není veřejný a víme, komu byl poskytnut, tak je to rozdíl proti stavu, že bude někde veřejně dostupný. Už dnes máme problém s ÚOOÚ, kterému se nelíbí, že jsou v katastru zveřejňována rodná čísla (pozn. je to odvěký spor, protože katastr je ze zákona veřejný). Pokud si někdo koupí list vlastnictví, tak je to velký rozdíl proti tomu, když by si hromadně a anonymně stáhl výměnný formát s osobními údaji všech vlastníků a jiných oprávněných všech nemovitostí ČR.

3) Veřejné = přístupné anonymně?
Pokud je něco zveřejněno jako open data, tzn. veřejně online dostupné, znamená to, že to musí být dostupné i anonymně? Nebo to může být přístupné jen po registraci, abychom věděli, kdo data odebral? Souvisí to i s předchozím odstavcem.

4) Stačí zveřejnit výměnný formát?
NVF obsahuje prakticky všechna zajímavá data z ISKN. Stačí tedy, pokud ho zveřejníme a splníme tím naši povinnost? Máme spoustu jiných výstupů, které využívají stejná data, jako jsou ta v NVF. Problém v tom, že například Výpis z KN je tak komplikovaný výstup, který, jak si troufám tvrdit,  nedokáže nikdo na základě dat z NVF správně sestavit tak, aby odpovídal tomu od nás (často i my s ním máme problémy :-) ). Dnes je poskytován elektronicky. Musí být dostupný i jako otevřená data nebo ne? Takových výstupů a sestav máme mnoho.

5) Náklady
Zveřejňování všech dat jako otevřené nepochybně přinese i náklady na úpravy existujících IS (nové s tím budou počítat, tak to tak strašné nebude) a infrastrukturu, což plyne i ze zkušeností států, které již takto data poskytují. V tento okamžik je obtížné náklady vyčíslit, v rámci návrhu usnesení jsou obecně rozmělněny do běžných rozpočtů jednotlivých organizací.

Mohl bych pokračovat dál. Výše uvedené otázky jsou jen to, co nás rychle napadlo. 
Jednodušší je to u RÚIAN. Ten má výměnný formát VFR, který je už dnes veřejný, zdarma, osobní údaje neobsahuje a můžeme ho celkem bez problémů jako open data v katalogu zveřejnit.

Zkrácená lhůta na připomínky u sice krátkého, ale závažného materiálu, který má velké dopady, je hodně podivná. Nenapadá mě žádný důvod, proč by v tomto případu mělo být využito zkrácené připomínkové  řízení, které se má používat ve výjimečných situacích a má být řádně odůvodněno:

Tohle je navíc naplánované tak, že je přes státní svátek a velmi pravděpodobné dovolené, což nám neumožní udělat kvalitní připomínky, protože záběr je velmi široký. Argument může být, že se to týká až VZ po 1.1.2018, ale to nemění nic na tom, že připomínky musíme dávat k záměru jako takovému, v obecné rovině. 
Celé je to podivné a "zkráceně zkrácený" termín vnáší pochybnosti, zda to není spíše jen rychlé politické rozhodnutí za účelem jeho bezproblémového protlačení ještě před volbami, aby v nich mohlo být patřičně využito. V materiálu "odůvodněno" takto:


Zveřejňování státních dat jako otevřená je určitě správná cesta, ale rozhodně bych to takto neuspěchával. Usnesení dále vůbec neřeší případné dopady na právní úpravy, které určitě v mnoha případech vzniknou, jinak nebude možnost publikace otevřených dat plnohodnotná. Ale to se už opravdu ve 3 dnech nedá zvládnout promyslet. Bohužel to vypadá jen jako předvolební, rychlý výkřik, bez nějakého hlubšího promyšlení. 

Úkol je zadán, tak ho musíme nějak zvládnout. Musíme jen doufat, že nenastane žádná mimořádná situace, který by způsobila vyhlášení veřejné zakázky na něco pro ISKN po 1.1.2018 (i to už jsme museli), protože pak by se už i na ISKN tato povinnost vztahovala. ISKN bohužel na tuto situaci není připraven, protože je rozdíl poskytovat NVF offline způsoben, na objednávku, nebo ho mít dostupné online, pro všechny a ještě možná s upravenými daty. Generování NVF je v ISKN nejnáročnější dávková úloha. Museli bychom tam úpravu pro otevřená data nějak rychle doplnit, doslova a písmene dolepit", což nemám rád, takové divoké úpravy moc systémově řešit nelze.
Po vyřešení výše uvedených dotazů (a spoustě dalších) začneme ISKN na tuto situaci připravovat a plánovat úpravy v rámci jeho normálního životního cyklu.

PS: Pro zajímavost - ČÚZK má v současné době ze všech státních orgánů nejvíce datových dat v Národním katalogu otevřených dat