Julkinen hallinto omistaa ja hallinnoi laajoja, rahallisesti ja yhteiskunnallisesti arvokkaita informaatiovarantoja. Suurin osa näistä raakamuotoisena datana olevista varannoista on tällä hetkellä vain niiden käytössä, joilla on pääsy aineistoihin. Datan jatkojalostukseen päätyy arvioiden mukaan vain pieni osa käytettävistä olevasta. Julkisten datavarantojen avaaminen edistää samanaikaisesti ainakin kolmea eri tavoitetta: demokratian ja hallinnon läpinäkyvyyden lisäämistä, uusien markk noiden ja innovaatioiden syntymistä ja hallinnon sisäisen tehokkuuden lisäämistä.
Suomi on hyväksytty 24.3.2013 Open Government Partnership (opengovpartnership.org/) (OGP) – kansainväliseen avoimen hallinnon kumppanuusohjelmaan, joka käynnistettiin 2011 YK:n yleiskokouksen yhteydessä New Yorkissa. Muita OGP- jäsenvaltioita ovat mm. Brasilia, Indonesia, Meksiko, Norja, Filippiinit, Etelä-Afrikka, Iso-Britannia ja Yhdysvallat. Suomen toimintasuunnitelmassa on neljä osa-aluetta: avoin toiminta, selkeä kieli, avoin tieto ja hallinto mahdollistajana.
Mitä on avoin data?
Informaatiotutkimuksen piirissä datalla tarkoitetaan merkeistä ja symboleista koostuvaa potentiaalista informaatiota. Data on raaka-ainetta, josta voidaan jalostaa merkityksellisempää informaatiota, jota puolestaan voidaan välittää edelleen. Informaatio muodostuu tiedoksi kun vastaanottaja tulkitsee saamansa informaation ja antaa sille merkityksen joka muuttaa tulkitsijan käsityksiä jostakin asiasta. Informaatiotutkimuksessa puhutaan yleisesti tiedon arvoketjusta (value chain of information), jossa irrallinen tieto jalostuu ihmiselle käytännössä hyödylliseksi.
Datalla tarkoitetaan digitaalisesti tallennettua informaatiota, kuten dokumentteja, tietokantoja sopimuksista, transkripteja kuulemisista ja audio- sekä visuaalisia tallenteita tapahtumista. Vaikka ei-elektronisessa muodossa olevat resurssit, kuten fyysiset esineet (esimerkiksi vanhat paperidokumentit), eivät kuulu julkishallinnon avoimen datan piiriin, niin tällaisten resurssien saattaminen mahdollisuuksien mukaan digitaaliseen muotoon on kannustettavaa. Euroopan tietoverkkorikollisuutta koskevassa yleissopimuksessa data tarkoittaa tosiseikkojen, tietojen tai käsitteiden esitystä sellaisessa muodossa, että se soveltuu käytettäväksi tietojärjestelmässä, mukaan lukien ohjelmat, joiden avulla tietokone pystyy suorittamaan jonkin toiminnon.

Data on avointa, kun se on…
- Laillisesti uudelleenkäytettävää: Data on avoimesti lisensoitu, eli sen käyttöä ei rajoiteta käyttäjäryhmän tai käyttötarkoituksen mukaan.
- Teknisesti uudelleenkäytettävää: Riittävän rakenteisessa muodossa (koneluettava) ja avoimessa tiedostoformaatissa oleva data on ladattavissa ilman rekisteröitymistä.
- Maksutta uudelleenkäytettävää: Datan käytöstä ei peritä maksua.
Mihin avointa data voidaan käyttää?
Mashup on yleisilmaisu julkisille, liike-elämän tai kansalaisten perustamille avoimen datan sovelluksille, jotka koostavat eri lähteistä saatavilla olevaa dataa niillä periaatteilla, joita palvelun perustajat haluavat. Mashup-termille ei toistaiseksi ole vielä vakiintunutta suomennosta, mutta Tekniikan sanastokeskuksen suosituksen mukaisesti sitä kutsutaan yhdistelmäpalveluksi. Suomessa tilannehuone.fi yhdisti Hälytyskeskuksen tilannetiedotuksen Google Maps’iin. Yksinkertainen ja kiinnostava tilannehuone.fi kiinnostaa, sillä siinä vierailee viikoittain lähes 300 000 kävijää.
Koulutuksessa dataa voidaan hyödyntää asioiden havainnollistamiseen. Esimerkki visualisaation voimasta on Tukholman Karoliinisen Instituutin professorin Hans Roslingin johdolla kehitetty GapMinder-palvelu. Ohjelmiston esiaste syntyi tarpeesta visualisoida opiskelijoille, kuinka 1960-luvulla syntynyt käsitys maailman kahtiajakautuneisuudesta perhekoon ja eliniän odotteen perusteella ei enää pidä paikkaansa.
Esimerkiksi liikennemittausten, julkisen liikenteen käyttötilastojen ja erilaisten alueita koskevien tilastojen perusteella voidaan tehdä kaupungin liikennejärjestelmää koskevia optimointimalleja tai vaikkapa yksityisen toimijan toimesta optimoida yrityksen palvelupisteverkostoa. Nykyisin erilaiset organisaatiot tekevät tämäntyyppisiä optimointeja ja simulaatioita nojautuen omiin datavarantoihinsa, mutta avoin data mahdollistaisi myös lisälähteiden ja muiden organisaatioiden datavarantojen hyödyntämisen.
Esimerkiksi erilaisten nettipalveluiden yhteydessä osoitelomakkeiden täydentämistä ja tarkistamista voidaan automatisoida postinumero- ja osoitedatan avulla. Voidaan ajatella myös lämmitys- ja ilmastointijärjestelmiä, jotka hyödyntäisivät säädataa, sekä sähköverkon kapasiteetista kertovaa dataa ja automaattisesti ohjaisivat itseään siten, että sähkön kulutus laskisi ja etenkin kulutushuiput tasaantuisivat (Smart Grid).
Oma lukunsa avoimen datan hyödyissä on aineiston laadun parantaminen ja kerääminen kollektiivisesti sekä päällekkäisen työn vähentäminen yhteiskäyttöisen datavarannon myötä. Jeff Howe (2006) kehitti termin crowdsourcing kuvaamaan internetin mahdollistamia uusia tapoja organisoida työtä. Termi tarkoittaa pelkistettynä perinteistä työn ulkoistamista (outsourcing) internetiin nimeämättömälle ihmisjoukolle (crowd). Termille ei ole vielä vakiintunutta suomennosta, on puhuttu esimerkiksi talkoistamisesta ja joukkouttamisesta. Crowdsourcing’issa on monia eri muotoja. Tyypillisesti joko etsitään parasta mahdollista ratkaisua, jota voi ehdottaa periaatteessa kuka tahansa, tai dataa kerätään, luokitellaan, lajitellaan, tuotetaan ja jalostetaan kollektiivisesti. Wiki pedia ja OpenStreetmap ovat kenties tunnetuimpia esimerkkejä crowdsourcing.
Hieman erilainen sovellus on Britanniassa toteutettu opetusaineistojen yhteistuotanto- ja jakelualusta Times Educational Supplement (TES). Sen on arvioitu säästävän opettajien työaikaa miljardin punnan edestä kahdessa vuodessa (UK 2009), kun opettajat ovat alkaneet palvelun kautta jakaa aineistoja keskenään sen sijaan, että kaikki tuottaisivat oman aineistonsa saman opetussuunnitelman mukaisten sisältöjen opettamiseen.
Yhteenveto
Datan avaamisen projektit eivät ole irrallisia teknisiä hankkeita, vaan ne kannattaa rakentaa dataa käyttävien ja jalostavien ihmisten ja yhteisöjen ympärille osaksi avoimen datan ekosysteemiä. Hyvin kuvailtu laadukas data luotettavasti toimivien rajapintojen kautta jaeltuna johtaa avoimen datan suurimpiin hyötyihin. Datan avaaminen vaatii kuitenkin aikaa ja resursseja. Mahdollisuuksia kuitenkin on.

Lähteet: Poikola, A – Kola, P – Hintikka, K.A: Julkinen data – johdatus tietovarantojen avaamiseen. (www.lvm.fi). Edita Prima Oy, Helsinki 2010 fi.opasnet.org/fi/Avoin_data (15.7.2015)
Pirjo Silius-Miettinen