Löydä ulkoisen datan parhaat apajat

Missä sijaitsevat ulkoisen datan parhaat apajat? Sukella syvään päähän ja opi, kuinka voit vauhdittaa ja värittää työskentelyäsi ulkoisen datan avulla.

Merelle

Maailma on täynnä dataa.

Ihmiset, puhelimet, autot ja jopa jääkaapit keräävät ja tallentavat jatkuvasti valtavan määrän mielenkiintoista aineistoa enemmän tai vähemmän käyttökelpoisessa muodossa – satelliiteista, lennokeista ja muista lennokkaista puhumattakaan. Kiitos viime vuosina heräilleen ja yhä voimakkaammaksi kasvaneen Avoin data -liikkeen, näitä aineistoja löytyy yhä helpommin ja yhä useammin myös täysin ilmaisena hyödynnettäväksi.

Eräs arvostamani entinen kollega onkin verrannut datan kanssa työskentelyä osuvasti kalastamiseen. Koska meri on täynnä kalaa (ei tietenkään oikeasti ole, mutta eläkäämme hetki edes kielikuvallisesti kestävässä maailmassa), tärkeää on kulloiseenkin tarkoitukseen soveltuvan saaliin löytäminen. Tällöin datan analysointia ja muuta hyödyntämistä voi verrata hyvän lohi- tai tonnikalapastan valmistamiseen. (Aterian täytyy tietysti olla kestävästi pyydetty ja kalan sertifioitua.)

Nykyisen kehityskulun seurauksena ulkoisen datan tarjoamat mahdollisuudet toiminnan tehostamiseksi kasvavat vähintäänkin samaa tahtia. Ulkoinen data voidaan määritellä esimerkiksi kaikeksi dataksi, joka tuotetaan ja hankitaan kulloisenkin toimijan ulkopuolelta.

On työskentelysi asiayhteys sitten tutkimustyö, metsänhoito tai vaikkapa vakuutus- ja finanssimaailma, löytyy näppäimistön ja näyttöpäätteen takaa useita lähteitä, joista hakea lisää dataa - eli tietoa ja viisautta. Datan tarjonta on parhaimmillaan sekä laajaa että monipuolista, mutta pahimmillaan ylivoimaisen upottavaa. Siksi asiaa on hyvä aluksi kehystää rajaamalla omaa ajatteluaan. ”Kaikkea on” ei tässä yhteydessä ole kovinkaan kannustava sanapari.

No mutta mitä sitten on? Jäsennän itse mielelläni datamaailmankaikkeutta hieman väkivalloin opintoajoilta tuttua asiayhteyksien erottelua peilaten:

On meitä ympäröivä luonnollinen ympäristö metsineen, vesistöineen, korkeuseroineen ja säätiloineen sekä toisaalta meidän luomamme rakennettu ympäristö kiinteistöineen, rakennuksineen ja tiestöineen.

Yllä mainituissa ympäristöissä liikkuu virtoja: vettä, ajoneuvoliikennettä ja tietoliikennettä. Näissä virroissa taas on useita liikkuvia ja ahkeroivia toimijoita: ihmisiä, yrityksiä ja ajoneuvoja.

Tästä kaikesta on saatavilla kokonaisvaltaista kuvaa luovaa kaukokartoitusaineistoa satelliiteista ja lentokoneista. Maan tasolla taas löytyy tätä kaikkea konemuodossa jatkuvasti mittaavaa laitelähtöistä tietoa, niin sanottua sensoridataa. Lisäksi saatavilla on tietoa tätä koko näytöstä ohjaavien tahojen eli hallinnon julkaisemien aineistojen muodossa. Lopulta löytyy koko kokonaisuuden yhteen sitovaa, valmiiksi pureskeltua ja niin sanottua perinteistä, rakenteellista tilastoaineistoa.

Jotta homma ei menisi pelkäksi listaamiseksi, on toki huomautettava, että kaikkia yllä mainittuja aihekokonaisuuksista kannattaa lähestyä usean lisäulottuvuuden kautta:

  • Kuinka saavutettavaa himoitsemani data on? Onko se maksumuurin tai rekisteröitymisen takana, vaiko täysin vapaata riistaa?
  • Millä resoluutiolla, ajallisella tai alueellisella, tarvitsen tietoa? Pitääkö minun tietää kuinka monta ihmistä tietyn liikkeen sisäänkäynnillä kulkee tuntitasolla, vai riittäisikö vuosittain päivittyvä postinumeroaluetason tilastotieto alueen väestöpohjasta?

Reseptit esille

Kuinka tuoda ulkoinen data mukaan päivittäiseen työhön?

Yleisin haaste soveltuvien datalähteiden löytämisen jälkeen lienee kyseisten aineistojen liittäminen olemassa oleviin varantoihin. Useita datalähteitä työstettäessä ei aina ole käytettävissä eri kokonaisuuksia yhdistävää avainta (vaikkapa nimeä tai postinumeroa), ja mitä useampaa aineistolähdettä käytetään, sitä monimutkaisemmiksi työvaiheet käyvät. Mikä siis avuksi?

Lähes kaikki data on suhteutettavissa sijaintiin tavalla tai toisella. Mobiilidata tarjoaa suuntaa-antavia tietoja ihmisten liikkeistä, rakennukset ja niissä sijaitsevat toimijat voi sijoittaa kartalle osoitteen perusteella ja tilastotieto taas luodaan usein jonkin alueellisen jaon pohjalta. Näin ollen sijaintitieto voi tarjota vahvan työkalun eri datalähteiden yhdistelyssä ja suhteuttamisessa toisiinsa.

Tietyssä ympäristössä vallitsevan säätilan voi esimerkiksi tuoda reittisuunnittelun tueksi läheisimmän sääaseman koordinaattitietojen perusteella, ja toimitilan T läheisyydessä liikkuvia kuluttajavirtoja voi kartoittaa vertaamalla toimipaikan osoitetietoa ja mobiilidatasta irrotettuja koordinaattipareja.

data recipe

Keittiöön

 

Mitä ulkoisen datan hyödyntäminen nykyisessä toiminnassa voisi käytännössä tarkoittaa?

Vakuutustoiminnassa avoimen säädatan yhdistäminen avoimiin metsävarainventaarioihin, kaupallisiin ilmakuvalähteisiin sekä kiinteistötietoihin voi auttaa myrskytuhojen lähes reaaliaikaisessa tunnistamisessa ja jopa ennakoinnissa. Maanpinnan muotojen ja tutkimuslaitosten julkaisema datan avulla sama pätee esimerkiksi tulvariskien mahdollisimman tarkkaan arviointiin.

Kivijalkaliiketoiminnassa toimintaa voidaan tehostaa yhdistämällä perinteistä myyntidataa oville sijoitetuista kameroista tai muista tunnistimista saatuihin ja iän ja sukupuolen mukaan eroteltuihin kävijävirtamittauksiin. Samalla kokonaiskuvaa voidaan laajentaa mobiilidatalla mitattuihin liikkeen ulkopuolella kulkeviin ihmisvirtoihin kaupallisista lähteistä. 

Toimipaikkasuunnittelussa taas voidaan kartoittaa potentiaalisia toimipaikkasijainteja esimerkiksi hyödyntämällä sisäistä aineistoa olemassa olevista toimipaikoista, avoimia alueellisia kuluttajatilastoja sekä historiallisia ja nykyisiä tieliikennevirtoja kuvaavia kaupallisia aineistoja.

Mistä alkuun?

Yhteenvetona todettakoon, että ulkoisen datan tuominen mukaan nykyiseen toimintaan lähtee tietoaukkojen tunnistamisesta.

  • Mikä on se kysymys, johon kaipaan vastausta?
  • Mitkä toimintamallit tuntuvat tällä hetkellä tehottomilta?
  • Toimisiko malli M paremmin, jos tietäisin enemmän asiasta A?

Vaihtoehtoisesti kannattaa kuluttaa hetki kartoittaen ulkoisen datan lähteitä ja seuraten pienempiäkin ideantynkiä. Mitä voisinkaan tehdä, jos koneellani olisi Excel-tiedosto nimeltä E?

Näin saatujen ajatusten ja nykyisten datalähteiden yhdistelystä datan tarve saattaa kirkastua nopeastikin. Täten oikeiden lähteiden rajaaminen omien valmiuksien ja käyttötarkoitusten mukaan alkaakin olla maustamista vaille valmista!

Aina tämä ei kuitenkaan ole niin helppoa, ja tukeutuminen asiantuntijoiden apuun voi helpottaa ja nopeuttaa omaa työtaakkaa huomattavasti. Alla olevasta linkistä pääset tutustumaan Location Intelligence Innovation -työpajaamme. Työpajan lopputuloksena saat konkreettisen ja perustellun näkemyksen hedelmällisimmistä sijaintianalytiikkaan liittyvistä kehityskohteista.

Tutustu Location Intelligence Innovation -työpajaan

 

 

 

Avainsanat: Sijaintitieto, Analytiikka, Tiedolla johtaminen, Edistynyt analytiikka

TILAA TUOREET ARTIKKELIT

Opi rakentamaan epäreilua kilpailuetua tiedolla johtamisella ja sijaintitiedolla.

Uudet blogiartikkelit sähköpostiisi heti julkaisupäivänä:

Ratkaisut

Valikoituja näytteitä tiedoistamme ja taidoistamme