TIVIA News: Tao sampoa linkitetyn datan kyselytyökaluilla

May 26, 2019 by
TIVIA News: Tao sampoa linkitetyn datan kyselytyökaluilla
Teräs Olli

Linkitetyt avoimen datan tietokannat (Linked Open Data) kytkeytyvät toisiinsa. Keskiössä on Wikidata, jonka yhteiset tietueet kytkevät eri tietokantojen vastaavat asiat toisiinsa.

Linkitetty avoin data on kovaa kamaa – kymmenien tuhansien avointen tietovarantojen faktoja voidaan yhdistellä lennossa uusiksi tiivistelmiksi tai visualisoinneiksi. Ne mahdollistavat Applen, Googlen ja Microsoftin älykkäiden apureiden älyn.

1990-luvun hype-sana “semanttinen web” on melkein hävinnyt ihmisten tietoisuudesta. Kyse on kuitenkin täysin samasta asiasta. Web oli alunperin linkitettyjä dokumentteja, semanttinen web taas linkitettyä dataa. Standardit ovat vaihtuneet RDF- ja XML-pohjaisista JSONiin, mutta samat toimintaperiaatteet pätevät edelleen.

Suomalaiset sammot

Tutkijat ovat vuosien aikana tuottaneet valtavia määriä dataa eri aiheita käsitteleviin varantoihin. Suomessa monet niistä on nimetty sammoiksi, esimerkiksi Biografiasampo, Sotasampo, Nimisampo ja Kulttuurisampo. Ne sisältävät korkealaatuista dataa, jonka keräämiseen on käytetty monesti useita henkilötyövuosia. Ja kaikki tämä on maksutta kenen tahansa käytettävissä.

Muita vastaavia asiantuntijoiden kokoamia avoimia linkitettyjä aineistoja ovat Semanttinen Finlex sekä kansallisbibliografia Fennica. Kansalliskirjaston Finto-palvelusta puolestaan löytyvät asiasanastot linkitettynä datana.

Wikidata on linkitetyn datan keskus

Wikidata, Wikipedian koneluettava sisarprojekti, toimii tietovarastona ja puhelinluettelona eri tietolähteiden välillä. Ensimmäinen Wikidatan vaikutus tuli näkyviin, kun sinne siirrettiin Wikipedian kielilinkit, jolloin siitä tuli kerralla monikielinen asiasanasto. Tämän jälkeen sitä on täydennetty tietokantojen tunnisteilla, jolloin Wikidatassa olevia tunnisteita voidaan käyttää linkitettäessä tietokannasta toiseen. Wikidata on myös itsenäinen joukkoistettu tietovarasto, jonka helpoiten pystyy ymmärtämään koneluettavana versiona Wikipedian tietolaatikoiden tiedoista.

SPARQL ja Wikidata käytännössä, esimerkkejä peruskoulusta

Miten saada avoin data käyttöön peruskoulussa? Yksi tapa voisi olla luoda avoin oppimisympäristö, jolla kuka vain voisi harjoitella hakujen tekemistä SPARQL-hakukielellä Wikidatasta. Näin kävikin helmikuussa IT-kouluttajien “Data opetuksessa – sanoista tekoihin” -työpajassa, jossa oppimisympäristö julkistettiin: http://www.teromakotero.fi/sparql/.

Työpajan tavoite oli, että sen loputtua kaikki osaisivat tehdä SPARQL-hakuja Wikidatasta. Tavoitteeseen myös päästiin. Pieniä paineita ehkä antoi se, että materiaalit oli jo kokeiltu peruskoulun 7–9-luokkalaisten kanssa ja heiltä se oli onnistunut.

Oppimisessa käytettiin pelaajaoppimisen metodia, joka on oppijalle haastava, mutta tehokas metodi oppia. Näin saatiin työpajaan myös pedagogiset kokeilut mukaan IT-kouluttajille sopivassa muodossa. Varsin hyvin se tuntui toimivan ennakkoluulottomien osallistujien kanssa ikähaitarista riippumatta.

Linkkejä linkitetyn datan varastoihin:
Sammot: https://www.ldf.fi
Finto: https://finto.fi
Fennica: http://data.nationallibrary.fi
Finlex: https://data.finlex.fi
Wikidata: https://query.wikidata.org

IT-kouluttajat ry:n Data opetuksessa -työpajan aineistot ja tallenteet:
http://itko.tivia.fi/fi/2019/data-opetuksessa 

 

Teksti: Tarmo Toikkanen, Tero Toivanen, Kimmo Virtanen
Kuva: https://lod-cloud.net

 

Linkitetyt avoimen datan tietokannat (Linked Open Data) kytkeytyvät toisiinsa. Keskiössä on Wikidata, jonka yhteiset tietueet kytkevät eri tietokantojen vastaavat asiat toisiinsa.
 

Jaa tämä kirjoitus
Tags
Arkistoi