Seuraava ehdokas avattavaksi dataksi Suomessa: Tilastokeskuksen ruututietokanta
Karttadataa avanneen Maanmittauslaitoksen johtava asiantuntija Antti Rainio haluaa Tilastokeskuksen Ruututietokannan avoimeksi dataksi. Ruututietokanta sisältää tilastoja, joissa 104 muuttujaa (pdf) on jaettu kartalle neliökilometrin kokoisiin ruutuihin. Suurista kaupungeista tilastoa on tarjolla 250×250 metrin ruuduissa. Aineiston avulla voidaan kartalla tarkastella esimerkiksi esimerkiksi eri ikäluokkien tulotasoa neliökilometrin kokoisissa alueissa.
Datalysaattori.fi teki Tilastokeskukselle tietopyynnön, josta selviää, kuka nykyisin aineistoa käyttää ja minkä verran tuloja aineiston maksullisena pitäminen tuottaa. Tulokset puhuvat puolestaan. Vuosina 2007–2011 aineiston myyminen on tuottanut Tilastokeskukselle rahaa noin 100 000 euroa vuodessa. Julkisen sektorin osuus tästä on ollut 15 000 – 20 000 euroa vuodessa. Seuraavassa ruututietoaineiston kokonaislaskutus Tilastokeskuksella vuosittain:
- 2007: 73 551 e
- 2008: 100 797 e
- 2009: 143 731 e
- 2010: 136 522 e
- 2011: 99 968e
- ESRI Finland Oy (74 000 e)
- Suomen Lähikauppa Oy (43 000 e)
- SOK, Asiakasomistaja- ja markkinointipalvelut (35 000 e)
- Xtract Oy (27 000 e)
- Bisnode Finland Oy (26 000 e)
- Affecto Finland Oy (18 000 e)
- K-Plus Oy (16 000 e)
- Ruokakesko Oy (13 000 e)
- Experian Oy (12 000 e)
- FCG Finnish Consulting Group Oy (11 000 e)
Rainion mielestä tarkka alueellinen tilastodata voisi auttaa esimerkiksi erilaisia kansalaisjärjestöjä tekemään ehdotuksistaan tarkempia ja perustellumpia. Myös opetuskäyttö ja kaikki muu kokeiluluontoinen – mutta potentiaalisesti tärkeä – aineiston käyttö jää nykyään tekemättä kynnysrahan vuoksi.
”Kyllä kai ahkeralla valistustyöllä voitaisiin saada joku huomaamaan, että tästä aineistosta kannattaa maksaakin. Kuitenkin paljon helpommin ja nopeammin päästään sinne maaliin, kun tieto avataan. Ne hyödyt tulevat sitten varmasti perässä. Niihin verrattuna tällaiset sadat tuhannet eurot ovat pikkusummia”, hän sanoo.
Rainio kertoo, että Maanmittauslaitoksen tapauksessa vain noin 15 prosenttia aineiston keräämiseen tarvittavasta rahasta saatiin kasaan aineistoa myymällä. Aineiston vapauttamisesta ehti jo syntyä pieni propagandasota, kun Valtiovarainministeriön budjettiosaston virkamiehet eivät olisi halunneet siitäkään tulovirrasta luopua.
Tänä keväänä Valtiovarainministeriö jo edellytti budjettiriihessä, että eri ministeriöt alkavat tuottaa ensi kevääksi ehdotuksia avattavasta datasta omilta hallinnonaloiltaan.
”Suosittelen ministeri [Henna] Virkkuselle, joka käy tulosneuvottelut Tilastokeskuksen kanssa, että jos näitä tietoja voi mielestäsi käyttää yhteiskunnassa muuhunkin, niin ota se neuvotteluissa huomioon”, Antti Rainio sanoo.
Datalysaattori on lähettänyt ministerin erityisavustajan kautta kommenttipyynnön Ruututietokannan avaamisesta Henna Virkkuselle 16.8.2012.
Päivitys 27.8.2012: Ruututietokantaa ei Virkkunen ole oikopäätä avaamassa, mutta aluetietokannan pitäisi olla avointa dataa vuoden vaihteessa.
Tilastokeskusen Ruututietokannan myyntiin liittyvät tiedot:
Kokonaislaskutus sektoreittain ja vuosittain 2007-2011 (Google Spreadsheet)
Kokonaislaskutus asiakkaittain 2007-2011 (Google Spreadsheet)
Ruututietokannan tietosisältö (pdf)

Mainiota. Tosin tulee mieleen, että ei kai ruututietokannan avaaminen johtaisi tunkeutuvamman markkinoinnin kehittämiseen entistä laajemmalla rintamalla?
Jos avaamiseen ei kustannussyistä suostuta, toivottavasti harkitaan vaihtoehtoisia hinnoittelumalleja. Esimerkiksi kaupallisesta käytöstä voisi edelleen laskuttaa mutta monotoonisen progressiivisesti ja/tai järjestöille, yksityishenkilöille tai tietyn liikevaihtomäärän alittaville datan hyödyntäminen voisi olla ilmaista. Näin markkinoita hallitsevaa duopolia voitaisiin edelleen laskuttaa 8-]
Tietysti voidaan kysyä, olisiko yksinkertaisempi ratkaisu kuitenkin lopulta parempi.
Erinomaista työtä mr. Datalysaattori!
Pingback: Tilastokeskus avaa aluetietokannan vuoden vaihteessa | Datalysaattori.fi
Pingback: Tilastokeskus avaa tietoja « Olipa kerran Bigdata