Avoimen tiedon kustannustehokas hyödyntäminen -hanke etsii keinoja siihen, miten avoimen datan ja keskeisten julkisen hallinnon perustietovarantojen tietojen hyödyntämistä ja vaikuttavuutta edistetään kustannustehokkaasti.
Toistaiseksi ETLA on tehnyt kyselytutkimusta ja kvantitatiivista analyysiä (ks. Kalvot alustavista tuloksista). Open Knowledge Finland on puolestaan haastatellut noin 25 henkeä 12 organisaatiosta.
Muutamia mielestämme tärkeitä poimintoja toistaiseksi haastatteluiden perusteella. Tämä kirjoitus EI yritäkään olla kaiken kattava kuvaus löydöksistämme, vaan tässä on nostettu esiin muutamia sellaisia asioita, jotka ovat ensi viikon työpajan kannalta uskoaksemme relevantteja.
Muutamia poimintoja haastatteluista
Vaikuttavuuden arviointi on tärkeää, mutta äärimmäisen vaikeaa. Monen mielestä tärkeä, mutta äärimmäisen vaikea aihe; jopa turhauttavaa. Vaikuttavuudessa on muitakin kulmia kuin taloudellinen. Yleisimmät tavat mitata vaikuttavuutta ovat lähinnä sovellus-casejen ymmärtäminen, ja datan käyttäjä- tai latausmääriä. Vaikuttavuuslaskelmia ei juuri ole, Ilmatieteen laitos on käynnistämässä omaa selvitystään, ja Maanmittauslaitoksen datasta on tehty vaikuttavuusselvitys.
Vaikuttavuuden arvioinnin, erityisesti datan käytön mittaamisen menetelmät, saattavat joiltain osin olla ristiriidassa avoimuuden määritelmän kanssa kanssa.
Jos ajatellaan, että vaikuttavuuden arvioinnissa yksi olennainen osa on datan käytön mittaaminen, voidaan tulla paradokseihin. Nimittäin jos datan käyttäjiä halutaan tunnistaa (kuten tietysti joskus on välttämätöntä), ei data enää ole määritelmällisesti avointa. ETLA:n Heli Koski kirjoitti mm. tästä DataBusiness-blogissa.
Yleisimmät tavat mitata datan käyttöä ovat lähinnä sovellus-casejen kautta, sekä mittaamalla datan käyttäjä-, käyttö- tai latausmääriä. Nämä luvutkaan eivät sinänsä suoraan mittaa vaikuttavuutta, vaikka ovat toki kiinnostavia ja tärkeitäkin indikaattoreita.
Datan löydettävyys, saatavuus, laatu ja helppous vaihtelevat reilusti.
Hallinnon avoimen datan portaali Avoindata.fi on tuttu, mutta läheskään kaikki datasetit eivät löydy sieltä. Datanomistajilla on hyviä omia avoimen datan sivuja, mutta osa dataseteistä on hiukan vaikeasti löydettävissä. Osa datanavauksista on avattu “helppouden”, ei merkitysellisyyden vuoksi. Monella toimijalla on lakisääteisesti kerättyä dataa hyvin avattu ja meneillään esimerkiksi tutkimustiedon avaaminen. Tuntuisi kuitenkin, että aika yksinkertaisilla löydettävyyttä parantaville toimenpiteillä voisi saada merkittävää lisäystä datan käyttöön.
Datanhyödyntäjien tuntemus ja vuorovaikutus heidän kanssa vaihtelevaa.
Käyttäjäryhmät tunnetaan kyllä usein, samoin yksittäisiä data hyödyntäviä caseja, mutta ei kootusti. Vuorovaikutus tiedon käyttäjien kanssa vaihtelee. Moni organisaatio on ollut mukana esimerkiksi Apps4Finland-/Open Finland Challenge -sovelluskilpailuissa, tai hackathoneissa (mm. Ultrahack). Säännöllistä kehittäjien ja datanomistajien välistä vuorovaikutusta on melko vähän – tässä yksi hieno esimerkki on Helsinki Region Infoshare, ja esimerkiksi sen jatkuva avokonttorikäytäntö (Hel <3 Developers), jossa datanomistajat ja -hyödyntäjät kohtaavat toisensa, kahden viikon välein. Voisiko valtion joidenkin toimijoiden tiimoilta olla jotain samansuuntaista toteutettavissa? Myös hackathonit ja kilpailut lisäävät konkreettista ymmärrystä haasteista ja tarpeista.
Avoin data osana organisaatioiden ohjausta
Avoin data usealla haastatellulla organisaatiolla kirjattu tulossopimukseen (ministeriön ja ko. organisaation välillä). Toisaalta avoimen datan suunnitelmat ovat muutaman vuoden takaa, usein 2013 vuodelta. Moni haastateltava koko tulosohjauksen hyväksi käytännöksi – pitäisikö tätä käytäntöä laajentaa entisestään? Samalla datanavaussuunnitelmat tulisivat päivitetyksi useammin? Pitäisikö vuorovaikutus käyttäjien kanssa tai vaikuttavuus saada mukaan tulosohjaukseen, ei “vain” tiettyjen datasettien avaaminen.
Dataspektri antaa pohdintaa datan avoimuuden koko skaalalle
Vaikuttavuutta voidaan lisätä myös “raottamalla dataa”, avaamatta sitä kokonaan.
Usein keskustelu pyörii sen ympärillä voidaanko jotain dataa avata vai ei. Saattaa olla hyödyllisempää pohtia samalla, voidaanko yhtenä vaihtoehtona avoimuutta tai käyttöä lisätä avaamatta dataa kokonaan. Open Data Institute (ODI) kuvaa datan avoimuutta dataspektrillä (data spectrum).
Spektrissä datan avoimuutta kuvataan viidella tasolla, suljetusta datasta avoimeen dataan. Englanninkielisessä versiossa “access” on vähän huonosti suomennettavissa, minusta “pääsy” sen koommin kuin “saavutettavuus” tai “saatavuus” eivät ole ihan optimaalisia termejä. Käytän tässä siis hiukan kömpelöä kieltä, korjausehdotukset tervetulleita.
“Sisäinen tieto” on tyypillisesti salaista tai hyvin rajattua tietoa oman tai organisaation sisäiseen käyttöön. Vaikkapa myyntiraportit, suuri osa työsopimuksista tai henkilökohtainen tieto on usein tätä.
“Nimetyn saatavuuden tieto” viittaa vaikkapa tietoon, jonka saa vain erillistä sopimusta vastaan. Tämä viittaisi esimerkiksi sellaiseen tietoon, jota kaupalliset toimijat saavat julkishallinnolta (vaikkapa Väestörekisterikeskukselta), ja jota hyödynnetään omassa käytössä tai jota jatkojalostetaan kaupallisiksi tuotteiksi.
“Ryhmäperustaisen saatavuuden tieto” vittaa tietoon, joka on saatavilla esimerkiksi autentikoinnin ja sen perusteella valtuutuksen perusteella. Nähdäkseni julkishallinnon organisaatioiden välinen tiedonvaihto kuuluisi tähän ryhmään.
“Julkinen tieto” – julkinen tieto, tai julkisesti saatavilla oleva tieto ei ole täysin avointa, esimerkiksi koska sen uudelleenkäyttöä rajoitetaan lisenssiehdoin, tai tieto ei muuten täytä kaikkiea avoimen määritelmän kriteerejä..
“Avoin tieto” – aidosti avoin tieto tai avoin data on sellaista, joka täyttää avoimen tiedon määritelmän, ja on siten esimerkiksi vapaasti kaupallisesti käytettävissä. Suurin osa haastatelluista organisaatioista julkaisee jotain avointa dataa, tyypillisesti JHS 189 mukaisella Creative Commons 4.0 -lisenssillä.
Ehkä yksi olennainen lisäkysymys voisi olla, “mitä voidaan tehdä, että siirryttäisiin dataspektrillä kohti oikea laitaa – ei välttämättä _oikeaan laitaan_”. Ja onko hypoteesi, että “mitä enemmän oikealla, sitä enemmän vaikuttavuutta” validi?
Entäs MyData? Kiinnostavaa on, että MyData -mallissa henkilö luvittaa oman tiedon käyttöä – ja tämä henkilötieto voidaan käyttötapauksesta riippuen (ja käyttötapauskohtaisesti) luvittaa mille tasolle vaan, jopa täysin avoimeksi. Voisi väittää, että MyData -luvittaminen lisää ko. datan vaikuttavuutta lähes vääjäämättä.
Muuta
On ilmeistä, että vaikuttavuuden lisäämisessä on paljon muustakin kyse. Resursseista, datan laadusta, datan maksullisuudesta, jne. – paneudutaan niihin myöhemmin projektin aikana.
Taustaa hankkeesta
Open Knowledge Finland ry ja Elinkeinoelämän tutkimuslaitos (ETLA) toteuttavat parhaillaan projektia “Avoimen datan kustannustehokas hyödyntäminen”, joka on osa Valtioneuvoston kanslian selvitys- ja tutkimustoimintaa (VN TEAS). Hankkeen yleisenä tavoitteena on tuottaa tietoa siitä, miten avoimen datan ja keskeisten julkisen hallinnon perustietovarantojen tai perusrekisterien tietojen hyödyntämistä ja vaikuttavuutta edistetään kustannustehokkaasti.
Tavoitteenamme on löytää ehdotuksia miten avoimen datan toimintaa kehitetään Suomessa. Tarkemmin sanoen, tavoitteena tuottaa ehdotuksia siitä, millaisia politiikkatoimia, toimintatapoja ja/tai rekisterien rakenteellisia muutoksia tarvitaan julkisen hallinnon tietovarantojen hyödyntämisen tehostamiseksi. Myöhemmin ehdotukset priorisoidaan.
Toistaiseksi projektissa on tutkittu avoimen datan hyödyntämistä kvantitatiivisella tutkimuksella ja kyselyn avulla (ETLA), sekä haastateltu yli 12 tiedonomistajaorganisaatiota (Open Knowledge Finland).
Projekti jatkuu työpajoilla 20.12.2016 ja tammikuussa 2017. Raportti valmistuu helmikuussa 2017, ja päätösseminaari pidetään 28.2.2017.
Haluatko osallistua tai kuulla lisää? Ota yhteyttä:
Mika,Honkanen@okf.fi – OKFI:n puolelta vastaava projektipäällikkö & puheenjohtaja 1.1.2017 alkaen
Teemu.Ropponen@okf.fi – OKFI:n projektiasiantuntija & toiminnanjohtaja