Seuraava ehdokas avattavaksi dataksi Suomessa: Tilastokeskuksen ruututietokanta

Karttadataa avanneen Maanmittauslaitoksen johtava asiantuntija Antti Rainio haluaa Tilastokeskuksen Ruututietokannan avoimeksi dataksi. Ruututietokanta sisältää tilastoja, joissa 104 muuttujaa (pdf) on jaettu kartalle neliökilometrin kokoisiin ruutuihin. Suurista kaupungeista tilastoa on tarjolla 250×250 metrin ruuduissa. Aineiston avulla voidaan kartalla tarkastella esimerkiksi esimerkiksi eri ikäluokkien tulotasoa neliökilometrin kokoisissa alueissa.

Datalysaattori.fi teki Tilastokeskukselle tietopyynnön, josta selviää, kuka nykyisin aineistoa käyttää ja minkä verran tuloja aineiston maksullisena pitäminen tuottaa. Tulokset puhuvat puolestaan. Vuosina 2007–2011 aineiston myyminen on tuottanut Tilastokeskukselle rahaa noin 100 000 euroa vuodessa. Julkisen sektorin osuus tästä on ollut 15 000 – 20 000 euroa vuodessa. Seuraavassa ruututietoaineiston kokonaislaskutus Tilastokeskuksella vuosittain:

  • 2007: 73 551 e
  • 2008: 100 797 e
  • 2009: 143 731 e
  • 2010: 136 522 e
  • 2011: 99 968e
Voit tarkastella laskutusta asiakassektoreittain (yksityinen, julkinen, muut) täältä (Google Drive).
Ruututietokanta kehitettiin ruotsalaisten kanssa yhteistyössä, kertoo Rainio. Tilastotietojen ongelmana on se, että esimerkiksi sosio-ekonomiseen asemaan liittyvät tiedot pitää summata isommiksi kokonaisuuksiksi, ettei yksilön tietosuoja vaarannu.

 

”Usein tiedot aggregoidaan erilaisiin hallinollisiin alueisiin, esimerkiksi kuntatasolle”, selittää Rainio.

 

Hänen mukaansa ongelmana on, että kuntatasoisen tilastotiedon kanssa jäämme historiallisten rajojen vangiksi. Tieto ei ole riittävän tarkkaa. Suomalaisten onneksi tietoa alettiin tilastoimaan neliökilometrin kokoisiin ruutuihin jo 1970-luvulla ja virallisemmin vuodesta 1980.

 

”Monista tilastoista löytyy jo kattavia aikasarjoja”, Rainio sanoo.

 

Tietoa kuitenkin käyttävät harvat. Vuosina 2007-2011 aineistoa on ostanut yhteensä 70 eri tahoa. Kymmenen tärkeimmän asiakkaan tilauksista on tullut puolet ruututietokannan myyntituloista vuosina 2007-2011. Kymmenen suurinta tilaajaa ovat
  1. ESRI Finland Oy (74 000 e)
  2. Suomen Lähikauppa Oy (43 000 e)
  3. SOK, Asiakasomistaja- ja markkinointipalvelut (35 000 e)
  4. Xtract Oy (27 000 e)
  5. Bisnode Finland Oy (26 000 e)
  6. Affecto Finland Oy (18 000 e)
  7. K-Plus Oy (16 000 e)
  8. Ruokakesko Oy (13 000 e)
  9. Experian Oy (12 000 e)
  10. FCG Finnish Consulting Group Oy (11 000 e)
ArcGIS-karttasoftaa valmistavan ESRIn tapauksessa kyse lienee eri toimeksiantajille tehdyistä projekteista. Selkeä kärkiryhmä tietojen käytössä on siis kaupan ala.
Raivio vaikuttaa hieman tuohtuvan Datalysaattorin esittämistä luvuista.

 

”On säälittävää, että meillä on tällaisia monopoleja tai duopoleja, joilla on varaa katsoa datasta, miten viimeisen päälle viilataan logistiikka, mutta yhteiskunnassa muu kehittäminen jää, kun tiedon päälle läiskäistään tällaiset hintalaput, joilla yritetään vain kuoria se kaikkein rasvaisin kerma päältä”, hän sanoo.

Rainion mielestä tarkka alueellinen tilastodata voisi auttaa esimerkiksi erilaisia kansalaisjärjestöjä tekemään ehdotuksistaan tarkempia ja perustellumpia. Myös opetuskäyttö ja kaikki muu kokeiluluontoinen – mutta potentiaalisesti tärkeä – aineiston käyttö jää nykyään tekemättä kynnysrahan vuoksi.

”Kyllä kai ahkeralla valistustyöllä voitaisiin saada joku huomaamaan, että tästä aineistosta kannattaa maksaakin. Kuitenkin paljon helpommin ja nopeammin päästään sinne maaliin, kun tieto avataan. Ne hyödyt tulevat sitten varmasti perässä. Niihin verrattuna tällaiset sadat tuhannet eurot ovat pikkusummia”, hän sanoo.

Rainio kertoo, että Maanmittauslaitoksen tapauksessa vain noin 15 prosenttia aineiston keräämiseen tarvittavasta rahasta saatiin kasaan aineistoa myymällä. Aineiston vapauttamisesta ehti jo syntyä pieni propagandasota, kun Valtiovarainministeriön budjettiosaston virkamiehet eivät olisi halunneet siitäkään tulovirrasta luopua.

Tänä keväänä Valtiovarainministeriö jo edellytti budjettiriihessä, että eri ministeriöt alkavat tuottaa ensi kevääksi ehdotuksia avattavasta datasta omilta hallinnonaloiltaan.

”Suosittelen ministeri [Henna] Virkkuselle, joka käy tulosneuvottelut Tilastokeskuksen kanssa, että jos näitä tietoja voi mielestäsi käyttää yhteiskunnassa muuhunkin, niin ota se neuvotteluissa huomioon”, Antti Rainio sanoo.

Datalysaattori on lähettänyt ministerin erityisavustajan kautta kommenttipyynnön Ruututietokannan avaamisesta Henna Virkkuselle 16.8.2012. 

Päivitys 27.8.2012: Ruututietokantaa ei Virkkunen ole oikopäätä avaamassa, mutta aluetietokannan pitäisi olla avointa dataa vuoden vaihteessa.

Tilastokeskusen Ruututietokannan myyntiin liittyvät tiedot:

Kokonaislaskutus sektoreittain ja vuosittain 2007-2011 (Google Spreadsheet)

Kokonaislaskutus asiakkaittain 2007-2011 (Google Spreadsheet)

Ruututietokannan tietosisältö (pdf)

16. elokuu 2012 by Jarno Liski
Categories: Uutiset | Tags: , , , , , , | 4 comments

Comments (4)

  1. Mainiota. Tosin tulee mieleen, että ei kai ruututietokannan avaaminen johtaisi tunkeutuvamman markkinoinnin kehittämiseen entistä laajemmalla rintamalla?

    Jos avaamiseen ei kustannussyistä suostuta, toivottavasti harkitaan vaihtoehtoisia hinnoittelumalleja. Esimerkiksi kaupallisesta käytöstä voisi edelleen laskuttaa mutta monotoonisen progressiivisesti ja/tai järjestöille, yksityishenkilöille tai tietyn liikevaihtomäärän alittaville datan hyödyntäminen voisi olla ilmaista. Näin markkinoita hallitsevaa duopolia voitaisiin edelleen laskuttaa 8-]

    Tietysti voidaan kysyä, olisiko yksinkertaisempi ratkaisu kuitenkin lopulta parempi.

  2. Erinomaista työtä mr. Datalysaattori!

  3. Pingback: Tilastokeskus avaa aluetietokannan vuoden vaihteessa | Datalysaattori.fi

  4. Pingback: Tilastokeskus avaa tietoja « Olipa kerran Bigdata

Vastaa käyttäjälle Antti Poikola Peruuta vastaus

Required fields are marked *