Elina Henttonen
Tekoäly voi tukea demokratiaa monin tavoin, jos sen käyttö toteutetaan vastuullisesti ja läpinäkyvästi. Sitä hyödynnetään esimerkiksi puntaroivissa kansalaiskeskusteluissa syntyvän aineiston jäsentämisessä, kuntien ja kaupunkien palautteiden käsittelyssä ja lainvalmistelun lausuntopalautteiden käsittelyssä. Tekoälyn avulla voidaan käsitellä, luokitella ja tiivistää suuria määriä kansalaisten mielipiteitä ja näkemyksiä ja luoda niistä kokonaiskuvia. Parhaimmillaan tekoälyn hyödyntäminen voikin parantaa päätöksenteon tietopohjaa ja tätä kautta edistää kansalaisten osallistumista. Samalla on kuitenkin huomioitava yksityisyydensuojaan, algoritmien toimintaan ja tulosten tulkinnan vastuullisuuteen liittyvät kysymykset.
Kansallisten dialogien tavoitteena on vahvistaa luottamusta, osallisuutta ja demokratiaa. Yhdellä Kansallisten dialogien kierroksella voidaan käydä toistasataa dialogia (tulevaisuudessa toivottavasti vielä enemmän). Jokaisesta dialogista toimitetaan meille kirjaukset, ja yksittäisen kirjauksen laajuus voi olla muutamasta sivusta useisiin kymmeniin sivuihin. Näin laajat aineistot ovat työläitä ja aikaa vieviä ottaa haltuun. Siksi halusimme myös Kansallisissa dialogeissa kokeilla ja luoda tapoja hyödyntää tekoälyä laajan dialogiaineiston analyysissa ja raportoinnissa sekä laajemminkin kokemustiedon jäsentämisessä. Tätä kautta tavoittelimme myös sitä, että dialogien yhteenvedon tuottamisesta tulisi nopeampaa ja kustannustehokkaampaa.
Tekoälytyökalut dialogiaineiston analyysissa
Lähdin kokeilemaan tekoälyn hyödyntämistä aineiston hallinnan ja analyysivaiheen tukena kevään 2025 mielen voimavaroista käytyjen Kansallisten dialogien laajalla aineistolla. Olin laatinut aiemmin useita vastaavia dialogiyhteenvetoja, joten laadin ensin itse ”ihmistyönä” teemoittelun ja jäsennyksen kyseisestä 117 dialogin aineistosta. Minulle oli tärkeää, että tuntisin aineiston läpikotaisin, jotta voisin verrata tekoälyn tuotoksia aineistosta omaan tuntumaani siitä ja arvioida näin tekoälyn ”osumatarkkuutta”.
Seuraavaksi kokeilin luokitella, jäsentää ja analysoida aineistoa kahdella eri tekoälytyökalulla (Googlen Gemini-kielimalliin perustuva Notebook LM ja suomalaisen yrityksen kehittämä, testivaiheessa oleva Skimle). Minua kiinnosti erityisesti se, miten tekoäly tiivistää, luokittelee ja teemoittelee aineistoa sekä millaisia kysymyksiä ja näkökulmia se tarjoaa aineiston jäsentämiseen. Halusin myös tarkastella, miten kahden eritekoälytyökalun tulokset eroavat toisistaan ja omasta analyysistani sekä mitä omassa analyysissani piiloon jäänyttä tekoäly voisi mahdollisesti nostaa esiin. Erityisesti minua kiinnosti, voisiko tekoäly monipuolistaa analyysia ja vahvistaa aineistosta tekemäni yhteenvedon moninäkökulmaisuutta, vai johtaako sen käyttö ennemmin erilaisten äänien tasapäistämiseen.
Havaitsin, että tekoäly on varsin toimiva työkalu ison datamassan jäsentelyyn. Se luokitteli asioita vähän eri näköisesti ja vähän erilaisiin kokonaisuuksiin kun minä, mutta luokittelut koostuivat samoista asioista kuin omani, vain hieman eri tavalla puettuina. Tämä oli toki olettavaakin, kun samasta aineistosta on kyse. Toisaalta se vahvisti minulle, että olen omassa jäsennyksessäni onnistunut kohtuullisen kattavasti kuvaamaan aineiston keskeiset teemat. Huomasin kuitenkin salaa toivoneeni, että tekoäly olisi myös haastanut omia jäsennyksiäni tavalla, joka olisi auttanut minua näkemään aineistosta jotain kokonaan uutta. Näin ei tapahtunut.
Ihmistyötä tarvitaan
Toimivuudestaan huolimatta tekoäly ei poista perusteellisen ihmistyön tarvetta. Tutkijalla on oltava tuntuma aineistoonsa, jotta hän voi arvioida tekoälyn siitä tekemiä luokitteluja ja jäsennyksiä. Omassa kokeilussani tekoäly ei ehdottanut virheellisiä sisältöjä, eikä hallusinoinut omiaan. Vailla hyvää tuntumaa aineistoon on kuitenkin vaikeaa arvioida erilaisten tekoälyn ehdottamien näkökulmien painoarvoa kokonaisuudessa. Tekoälyn tuottamassa sisällössä on myös sellainen piirre, että ensimmäisellä vilkaisulla se näyttää tosi hyvältä, joskus suorastaan hämmästyttävältä. Kun sisältöä lähtee työstämään tarkemmin, saattaa kuitenkin törmätä teemojen tasapaksuuteen, toistoon ja päällekkäisyyksiin, merkitystyhjään kieleen ja punaisen langan hapertumiseen.
Tutkijan tehtäväksi jää myös havaintojen asettaminen kontekstiinsa. Omassa kokeilussani olin anonymisoinut aineiston täysin, jolloin tekoälyllä ei ollut käytössään keskusteluiden järjestäjä- ja osallistujatietojen kaltaisia metatietoja. Keskustelujen sisällön perustella se toki pystyi tekemään paljon luokituksia ja tulkintoja, mutta anonyymin aineiston kanssa tutkijalla on oltava selkeä systeemi, jolla hän tarvittaessa voi yhdistää yksittäisiä havaintoja keskustelun metatietoihin.
Tekoälyn hyödyt tiivistettynä
- Toimiva ja helppokäyttöinen työkalu suuren datamassan jäsentämiseen ja aineiston hallintaan.
- Nopeuttaa ja sujuvoittaa aineiston käsittelyä.
- Mahdollistaa erilaisten promptien kautta monipuolisen aineiston tarkastelun ja tuottaa kätevästi erilaisia visualisointeja ja taulukointeja aineistosta.
- Mahdollistaa kohdennetut täsmähaut aineistosta. Mikäli haluan esimerkiksi tarkistaa, millä kaikilla tavoin aineistossa puhutaan ilmastomuutoksesta, voin pyytää tekoälyä poimimaan minulle kyseiset aineistokohdat sen sijaan, että selaan itse tuhansia sivuja aineistoja uudelleen läpi.
- Toimii ikään kuin aineiston toisena lukijana ja mahdollistaa näin tutkijalle omien tulkintojen peilaamisen ja käsittelyn kattavuuden.
Tärkeää huomioida tekoälyn käytössä
- Aineistoon oltava hyvä tuntuma, jotta pystyy hyödyntämään tekoälyä viisaasti. Valtavan suurella aineistolla tuntumaa voi hankkia perehtymällä myös ”edustavaan otokseen” aineistosta.
- Tekoälylle kaikki sanat ovat periaatteessa samanarvoisia, eikä se osaa tulkita asioita suhteessa kontekstiin tai johonkin laajempaan tulkintakehykseen, ellei sitä sille tarjoa. Siksi syötteillä eli ”prompteilla” on tärkeä merkitys ja niiden muotoiluun tulee kiinnittää huomiota. Onneksi erilaisia syötteitä on helppo testailla. Kun aineiston tuntee, voi syötteillä houkutella aineistosta esiin erilaisia näkökulmia. Vailla omaa tuntumaa aineistoon voi riskinä olla, että tekoäly tasapäistää lopputulosta, eikä tutkija tätä tunnista.
- Tekoälyn tuottamien luokittelujen työstämiseen, analyysityöhön ja asioiden merkityksen arvioimiseen tarvitaan aikaa ja ihmistyötä. Myös laajempiin kehyksiin ja konteksteihin asettaminen sekä tarinallisuuden rakentaminen vaativat ihmistyötä.
- Tekoälyavusteisen analyysin eri työvaiheet on hyvä dokumentoida analyysin läpinäkyvyyden vuoksi.
- Osa dialogeista on litteroitu tekoälyllä ja kirjauksissa saattaa siksi olla virheitä. Tässä on riskinä, että tekoäly analysoi tekoälyn kirjaamaa aineistoa, jolloin virheet voivat kertautua.
- Tieto- ja yksityisyydensuojaan tulee kiinnittää huomiota. On varmistettava sisältääkö aineisto henkilötietoja tai epäsuoria tunnistetietoja ja miten aineisto anonymisoidaan tai pseudonymisoidaan. On pohdittava, käytetäänkö paikallisia vai pilvipohjaisia järjestelmiä, ja onko käytetty tekoälytyökalu luotettava tietosuojan näkökulmasta.
- Joissakin tilanteissa tekoälyn käyttö voi etäännyttää osallistujia ja heikentää heidän omistajuuttaan lopputulokseen, mikäli he eivät luota tekoälyyn tai heillä ei ole tarpeeksi tietoa siitä, miten sitä kyseisessä tapauksessa on käytetty. Läpinäkyvyys ja viestintä on tässäkin tärkeää.