TIVIA ry | Finnish Information Processing Association
Tekoäly ja data kuluttavat järjettömästi energiaa

Kasvujohtaja Janne Kalliola Exove Oy:stä oli Teknologia 23 -tapahtuman TIVIA Stagen toisen päivän päivän eli keskiviikon 8.11.2023 ensimmäinen puhuja.

Jouluna 1983 lahjaksi saadulla VIC-20:lla ohjelmoinnin aloittanut ja 17 vuotta sitten Exoven perustanut Kalliola perusteli noin kolmen vuoden rupeamaansa vihreän IT:n parissa: ”Jos emme jotakin tälle asialle tee, me IT-teollisuudessa osaltamme tuhotaan maapallo, ja täytyy muistaa, että kuolleella planeetalla ei voi tehdä bisnestä. Eli sen takia on tärkeätä säilyttää se.” Toki Kalliola toivoi elinkelpoista planeettaa myös lapsilleen ja paikalla oleville nuorille.

Suomi on maailman ensimmäinen maa, joka on tehnyt IT-alalle ilmastostrategian. Sen valmistelutyön yhteydessä havaittiin, että ICT-sektori käyttää 4–10 % maailman energiankulutuksesta. Lancasterin yliopisto puolestaan on arvioinut, että ICT-sektorin kasvihuonepäästöt ovat 2,1–3,9 % maailman kasvihuonepäästöistä. ICT-sektori on siis yhtä suuri syntinen kuin lentoteollisuus, ICT:n osuudesta kasvihuoneilmiöön ei vain puhuta samalla tavoin kuin lentoteollisuudesta. ”Olemme oikeasti iso saastuttaja ja – toisin kuin monen muun – meidän numerot kasvaa”, Kalliola painotti. Moni muu ala jo pienentää lukujaan, me emme vielä. Asialla täytyy tehdä jotain. ICT-alan vuotuiset CO2-päästöt ovat 1,6 miljardia tonnia joka vuosi. Määrä vastaa ihmisten ja maanisäkkäiden massaa!

Kalliolan mukaan asiaan on kolme suurta syntipukkia: tekoäly, data ja kryptot, joista hän keskittyy tässä esityksessä kahteen ensimmäiseen. Kryptovaluutoista hän totesi, että jos kuulijoilla on bitcoineja, hän kehotti pitämään ne lompakossa, sillä yksittäinen treidaus vie noin miljoona kertaa enemmän sähköä kuin luottokorttimaksu. Bitcoin vie Kalliolan mukaan Argentiinan verran sähköä.

”Tekoäly on äärimmäisen energiaintensiivistä puuhaa”, Kalliola totesi. On arvioitu, että Google käyttää 10–15 % sähkönkulutuksesta tekoälyynsä. Kulutus vastaa Olkiluodon kolmannen yksikön kahden kuukauden tuotantoa vuodessa, ja OL3 on sentään maailman suurimpia ydinreaktoreita.

Tekoälyn energiankulutus syntyy kolmessa vaiheessa. Ensimmäisen vaiheen muodostaa tekoälyn opetusdatan kerääminen ja laittaminen kuntoon. Käytetyt tekstimassat ovat suuria, jotka on vielä siivottava, yhdisteltävä ja päivitettävä. Lisäksi on varmistettava, että opetusdatassa ei ole vinoumia. Tämä syö paljon energiaa.

Toisen vaiheen muodostaa puolestaan tekoälyn opetus. Siinä tekoälyn neuroverkko rakentuu opetusdatan avulla. Voi olla, että työhön tarvitaan kaksi tekoälyä, joista toinen tekee varsinaisen työn ja toinen arvioi tuotoksia, mikä nopeuttaa prosessia. Molemmat tekoälyt kuluttavat huomattavasti sähköä. Tekoälyn päivittäminen tarkoittaa uudelleen opettamista, mikä on luonnollisesti hyvin paljon energiaa kuluttavaa toimintaa.

Kolmannen vaiheen muodostaa tekoälyn käyttö. Esimerkiksi ChatGPT:n mallin lataaminen palvelinten muistiin vie energiaa, mallin ajamisesta puhumattakaan; tarvittava laskenta on monimutkaista.

Energiankulutuksen jakautuminen näiden kolmen vaiheen välillä vaihtelee käyttötapauksen mukaan. Joissakin tapauksissa käyttö on pientä verrattuna opetusdatan keräämiseen ja tekoälyn opettamiseen. Voi olla myös toisin päin. Yksittäisen ChatGPT-kyselyn sähkönkulutus on 1,7–2,6 Wh. Ei kuulosta paljolta, mutta kymmenen miljoonan päivittäisen kyselyn yhteinen kulutus on 17–26 MWh, joka ei enää ole mitätön luku.

Tekoälyn kohdalla kannattaa Kalliolan mukaan ensimmäisenä miettiä, onko se oikeasti tarpeen, vai riittäisikö ”if-else-hässäkkä”, heuristiikka tai tilastolliset menetelmät? Tuottaako tekoäly aidosti parempaa tulosta, mikä sen arvonlisä on verrattuna kustannukseen?

Toiseksi on mietittävä, miten tekoälyn käyttöä rajataan, jotta käyttö kohdistuu asioihin, joilla on arvoa. ”Maksimoidaan arvo ja minimoidaan ympäristöjälki”, Kalliola totesi.

Kolmanneksi on etsittävä paras tekoälymalli ja hankitaan se paikasta, jolla hiilijalanjälki on järkevä. Esimerkiksi Suomessa sähkö on 11 kertaa puhtaampaa kuin Saksassa, mikä näkyy suoraan hiilijalanjäljessä.

Neljänneksi on määriteltävä, miten tekoäly opetetaan. Mikä on järkevä tapa kerätä opetusdata, ottaen tekijänoikeudet, eettiset asiat, vinoumat ja energiakulutus huomioon?

Viidenneksi on määriteltävä tekoälyn kokoonpano ja mitattava sen energiankulutus. ”Konfiguraatiolla voi vaikuttaa paljon tekoälyn tarkkuuteen, mutta voi olla, että tarkkuus ei kasva samassa suhteessa kuin energiankulutus kasvaa, ja saattaa jopa huonontua, kun energiankulutus kasvaa”, Kalliola totesi.

Kuudenneksi aiheesta syntynyttä tietoa pitää jakaa, koska sitä on jaossa vielä aika vähän. Kaikki julkistamiskelpoinen kannattaa julkistaa.

TIVIAn jäsenenä olet osaavassa seurassa

Henkilöjäsenenä pidät oman ammattitaitosi ajan tasalla, luot kontakteja ja kehität alaa sekä hyödyt eduista.


Dataa maailmassa on hämmentävän paljon. IDC:n mukaan vuonna 2018 maailmassa oli dataa 33 zeetatavua ja 175 zeetatavua vuonna 225. Yksi zeetatavu on miljardi teratavua. Datan määrä kasvaa. Mobiilidatan määrä on kasvamassa vuoden 2022 tasolta 15 gigatavusta kuukaudessa vuoden 2025 tasolle 75 gigatavua kuukaudessa, ja kiinteän verkon osalta luvut ovat 225 gigatavua ja 900 gigatavua. Lisäksi videon osuus datasta kasvaa 66 prosentista 74 prosenttiin vuoteen 2030 mennessä. ”Kaikki, jotka katsovat kaksi tuntia TikTokia päivässä: hävetkää, ja kannattaa lopettaa, koska a) se mädättää aivot ja b) se kuluttaa ihan törkeästi luonnonvaroja. Lisäksi se on Kiinan paras tapa saada henkinen yliote Yhdysvalloista, koska TikTok on Kiinassa kielletty”, Kalliola painotti.

Datan kasvu johtuu Arthur D. Little -tutkimuslaitoksen mukaan laitteiden käyttö on tasaantumassa 3–4 tuntiin päivässä kehittyvissä maissa, mutta datan intensiteetti kasvaa, koska videoiden resoluutio kasvaa, videoita käytetään enemmän sosiaalisessa mediassa, internetiä käytetään uusiin käyttötarkoituksiin, kuten verkkokokoukset, konsertit ja verkkokauppa, AR- ja VR-ratkaisujen takia sekä tekoälyn tuottaman sisällön määrän kasvun myötä. ”Nämä eivät paranna ihmiskunnan tilaa, eikä lyhyttä hetkeä lukuun ottamatta mikään ei muutu paremmaksi, valitettavasti”, Kalliola totesi.

Vain semmoista dataa, millä on arvoa ja mistä on hyötyä bisnekselle, kannattaa kerätä. Kannattaa myös harkita, kannattaako dataa kerätä ”varmuuden vuoksi”. Saattaa kannattaa myös tallentaa vain datasta laskettu informaatio, ja heittää raakadata pois. Kannattaa poistaa tai arkistoida vanha data, jota ei käytetä, tai tehdä siitä aikasarjoja. Viides Kalliolan neuvo datan suhteen oli noudattaa GDPR:ää orjallisesti – suomalaiseen tyyliin.

Yhteenvetona Kalliola totesi, että tekoäly ja data ovat energiaintensiivisiä. Niiden käyttöön tulee olla hyvä syy. Taistelut pitää valita, sillä ongelmat eivät ole tekoälyn arvoisia, ja kannattaa ymmärtää, että tekoäly tietää vain, mitä on tapahtunut, eikä innovoi. Ympäristöjalanjäljen selvittäminen näissä asioissa on myös olennaista. Kalliolan mukaan olemme matkalla, sillä mitään muutosta ei kannata olettaa tapahtuvan kerralla. On muutettava sellaisia asioita, joilla on merkitystä. Ei pidä asettaa liian kunnianhimoisia tavoitteita eli yrittää syödä elefantti kokonaisena. ”Jos te uuvutte tällä matkalla, koska koette ilmastoahdistusta tai teette liian paljon töitä, teidät korvaa joku vatipää, joka ei välitä senkään vertaa ympäristöstä, ja maailman tila on huonompi”, Kalliola evästi yleisöä. Kannattaa siis pitää itsestään huolta ja muistaa, että jokaisen matkan tärkein askel on se ensimmäinen.

Kalliolan kirja on tarjolla ilmaiseksi Exoven verkkosivuilla, suomeksi osoitteessa exove.com/vihrea-koodi ja englanniksi osoitteessa exove.com/green-code.

Teksti: Reino Myllymäki
Kuva: TIVIA ry 





Jaa tämä kirjoitus
Arkistoi