14.11.2024 / Ohjelmistoratkaisut

Koneoppiminen: Mitä, miten ja miksi?

Koneoppiminen on yksi tekoälyn tärkeimmistä osa-alueista. Sen avulla voit tehdä datasta arvokkaita löytöjä, jotka muuten jäisivät piiloon. Koneoppiminen tuo liiketoimintaasi uusia kilpailuetuja, joita asiakkaasi arvostavat.

Tässä artikkelissa tulet tutuksi koneoppimisen perusteiden ja tärkeimpien paradigmojen kanssa. Puhallat pois kuuman ilman hypen ympäriltä ja tiedät, mitä pitää ottaa huomioon, kun haluat tuoda koneoppimisen osaksi omaa liiketoimintaasi.

Saat myös tietää, mitä pitää huomioida vaativan ammattikäytön sovelluksissa tai korkean turvatason datan käsittelyssä. Tekoälyllä on ehdottomasti paikkansa sielläkin – kunhan olet tiettyjen riskien kanssa valppaana.

Jos haluat luoda aitoa kilpailuetua koneoppimisesta, katso tallenne "Ymmärrätkö datasi mahdollisuudet" -webinaaristamme!

Artikkelin sisältö:

Mitä on koneoppiminen?
Mihin koneoppimista voi soveltaa? Esimerkkejä vaativasta ammattikäytöstä
Datan laatu – kiinnitä huomiota näihin seikkoihin
Mitä työkaluja ja teknologioita mallien rakentamiseen tarvitaan?
Koneoppimisen kolme päätyyppiä
- Ohjattu oppiminen
- Ohjaamaton oppiminen
- Vahvistusoppiminen
Mitä on MLOps?
Voiko koneoppimista soveltaa turvallisuuskriittisissä, suljetuissa ympäristöissä?
Kuusi askelta oppivien tekoälymallien hyödyntämiseen

Mitä on koneoppiminen?

Lyhyesti sanottuna koneoppiminen (Machine Learning) tarkoittaa laskennallista datan käsittelyä, jossa teknologia louhii suuria datamassoja ja tuottaa niistä analyysin, jota kutsutaan malliksi.

Datan määrä ja laatu ovat ratkaisevan tärkeitä, jotta oikeasti onnistut kehittämään uutta tai saat lisää potkua nykyiseen sovellukseesi.

Vielä tärkeämpää on tunnistaa tarkasti ongelma, jota olet ratkomassa. Vain silloin voit löytää käyttöösi osuvimmat koneoppimisen algoritmit ja saat tekoälyponnisteluistasi todellista hyötyä.

Jokainen koneoppimisen kokeilu etenee vaihe vaiheelta:

1) Ongelman rajaus: Ymmärrä ja määrittele liiketoimintaongelma, johon etsit ratkaisua

2) Datan tarkastelu: Varmista, että käytettävissä olevasta datasta voi muodostaa ratkaisuja ongelmaan

3) Datan esikäsittely: Muokkaa data algoritmien ymmärtämään muotoon (mm. puuttuvien arvojen korvaaminen, muuntaminen numeeriseen muotoon, datan skaalaus)

4) Koneoppimisen mallin valinta ja koulutus: Tässä niin kutsutussa eksploraatiovaiheessa valitse ongelmaan sopiva malli ongelman tyypin, käytettävissä olevan datan ja halutun tarkkuuden perusteella. Opeta valittu malli tuottamaan opetusdatan avulla ennusteita uudesta datasta.

5) Mallin validointi: Varmista uuden testidatan avulla, että malli toimii hyvin myös datalla, jota se ei ole ennen nähnyt. Viimeistään validointivaiheessa pystyt vertailemaan myös eri mallien suorituskykyä ja valitsemaan niistä parhaan.

6) Käyttöönotto: Ota malli käyttöön tosielämässä, eli integroi se osaksi sovellustasi tai järjestelmääsi.

7) Iteratiivinen kehittäminen: Tekoälyn kanssa pääset harvoin ensimmäisellä yrittämällä maaliin. Koneoppimiseen kuuluu aina jatkuvaa kehittämistä, jossa säädetään sekä dataa, algoritmeja että mallin parametreja.

Tekoäly vs. koneoppiminen

Arkipuheessa tekoäly ja koneoppiminen sekoittuvat usein keskenään. Niiden ero on, että tekoäly (AI) on laajempi yläkäsite. Se voi viitata mihin tahansa ongelmanratkaisuun, joissa tietokone hoitaa tehtäviä ihmisen älyä jäljittelemällä. Se voi ratkoa ongelmia, tehdä päätöksiä ja tulkita kieltä ihmisaivojen puolesta.

Koneoppiminen sen sijaan on tekoälyn tärkeä osa-alue, joka nojaa tietokoneiden kykyyn oppia ja tehdä päätelmiä datasta. Koneoppimisen mallit tunnistavat datasta säännönmukaisuuksia ja tekevät niiden perusteella sitten uusia havaintoja ja ennusteita ilman, että ihminen erikseen ohjelmoi jokaisen askeleen ja syy-seuraussuhteen.

Tekoäly voi siis tarkoittaa mitä tahansa älykästä järjestelmää, kun koneoppiminen taas on tapa toteuttaa tekoälyä käytännössä.

Mihin koneoppimista voi soveltaa? Esimerkkejä vaativasta ammattikäytöstä

Julkisuudessa tekoälypuhe keskittyy toimistorutiinien tehostamiseen, deepfake-videoihin ja näyttäviin kuvituksiin tai siihen, jaksaako robotti-podcastien parissa todella viihtyä.

Kun hypen verhoa hieman raottaa, nähdään, miten monenlaisia hyötyjä tekoälystä voidaan saada ammattilaissovelluksissa. Tässä muutama esimerkki ongelmista, joita koneoppiminen voi ratkoa eri toimialoilla:

Terveydenhuolto voi hyödyntää koneoppimista esimerkiksi vaikuttavien, yksilöllisten hoitopolkujen räätälöinnissä, lääkityksen optimoinnissa sekä kuvantamisen analyysissa.
Logistiikka-alan yritys lisää kilpailukykyään älykkäällä reittisuunnittelulla, varastotilausten ja toimitusten optimoinnilla sekä kuljetuskaluston paremmalla hallinnoinnilla.
Energia-alalla tekoäly analysoi sääolosuhteita ja kulutustrendejä ja viilaa tuotannon ja kulutuksen välisen suhteen kohdilleen. Ennakoiva kunnossapito auttaa rytmittämään huoltotyöt maantieteellisesti hajautetuissa kohteissa järkevästi.
Valmistavassa teollisuudessa koneoppimisen mallit tehostavat laadunvalvontaa ja prosessien optimointia. IoT-sovelluksissa älykäs kunnonvalvonta, laiteprofilointi ja reunalaskenta (edge computing) tuovat etumatkaa kilpailijoihin.

Malli kuin malli tarvitsee toimiakseen riittävästi laadukasta dataa. Koneoppimisen kokeiluihin tarvitaan malttia ja pitkäjänteisyyttä, sillä ammattiympäristöissä ongelmat voivat olla monimutkaisia, ja oppiminen vie aikaa.

Ja mitä kriittisemmistä toimialoista on kyse, sitä tarkempi on oltava sen kanssa, että uutta kehittäessä huomioidaan toimialaa koskeva sääntely ja henkilötietojen suojaaminen.

Optimointi on koneoppimisen lyömätön hyöty

Liiketoiminnan tavoitteista riippuen tekoälyhankkeisiin latautuu erilaisia odotuksia. Siinä missä suoratoistopalvelu keskittyy asiakaspitoon viihdemieltymyksiä ennustamalla, kiinnostaa yhteiskunnan rattaita pyörittäviä yrityksiä useimmiten vaikuttavuuden ja kustannustehokkuuden lisääminen.

Logistiikka-alan reittisuunnittelu voi tähdätä entistä nopeampaan jakelupalveluun entistä pienemmällä polttoaineen kulutuksella. Terveydenhuollossa ratkottavana voi olla parempien hoitotulosten ja harvempien käyntikertojen haastava yhtälö. Teollisuusyritys haluaa painaa päästönsä alas etsimällä prosesseista tyhjäkäynnin paikat.

Koneoppimisen vaatiman laskentatehon energiankulutus puhuttaa, eikä huoli ole tuulesta temmattu, varsinkin jos algoritmeja ei ole rakennettu tarkoituksenmukaisesti. Optimoinnilla saavutetut hyödyt voivat kuitenkin parhaimmillaan olla niin merkittävät, että parannuksista kiittää tuloslaskelman lisäksi ympäristö.

Datan laatu – kiinnitä huomiota näihin seikkoihin

Datan lähteinä voi käyttää yritysten omien tietokantojen lisäksi muun muassa sensorien keräämää dataa tai avoimien lähteiden aineistoja.

Laadukas data on riittävää, tarkkaa ja ajantasaista. Se on virheetöntä ja käyttökelpoisessa muodossa. Paljon vaatimuksia! Mistä niitä kannattaisi lähteä purkamaan?

Kaikki palautuu ratkottavan ongelman määrittelyyn. Ajatellaan, että tarkoitus on ennustaa asiakkaiden tulevaa käytöstä varastotilausten optimoimiseksi. Heidän toiminnastaan tähän asti kerätty data voi olla virheetöntä ja tarkkaa, mutta käyttökelvotonta, jos siitä ei löydy muuttujia, jotka korreloisivat käyttäytymisen kanssa.

Laadukkaan datan tunnistaminen kysyy myös ymmärrystä liiketoiminnasta ja tarkkaa silmää. Väärin kalibroitu anturidata voi olla hyvin täsmällistä, mutta säätövaiheen virheen vuoksi sillä ei ole tekemistä todellisuuden kanssa.

Hyvälaatuinen data mahdollistaa tarkempien ja luotettavampien mallien luomisen. Huonolaatuinen data voi johtaa virheellisiin ennusteisiin ja vääristymiin, hukkaan valuneista euroista puhumattakaan.

Toisaalta alussa hyvältä vaikuttanut data voi osoittautua hieman vääränlaiseksi koneoppimisen mallin tarpeisiin. Siksi jatkuva iterointi on niin tärkeää alusta alkaen.

Datan valmistelu koneoppimismallia varten

Ennen kuin voit syöttää dataa koneoppimismallille, se on vielä esikäsiteltävä juuri kyseiselle mallille sopivaksi. Esikäsittelyllä tarkoitetaan muun muassa:

datan puhdistamista, kuten virheellisten arvojen korjaamista sekä vääristävien poikkeamien ja tuplatietojen poistamista
datan muuntamista, eli esimerkiksi paikkakuntien nimien vaihtamista tekstistä numeeriseen muotoon
datan jakamista opetus-, validointi- ja testidataan.

Mitä työkaluja ja teknologioita mallien rakentamiseen tarvitaan?

Koneoppimisen mallien koodaamiseen käytetään paljon perinteisiä työkaluja sovelluskehittäjän pakista: ohjelmointikieliä (tyypillisesti Python ja R), kirjastoja, konttiteknologioita ja versionhallintajärjestelmiä sekä lisäksi datan pureksimiseen tarkoitettuja laskentaympäristöjä.

Pilvipalvelut, kuten Amazon Web Services (AWS), Microsoft Azure ja Google Cloud Platform tarjoavat kattauksen käteviä palveluita datan käsittelyyn: muun muassa laskentakapasiteettia, tallennustilaa ja valmiiksi koulutettuja malleja.

Koneoppimisen kokeilut voi aloittaa hyvin ketterästikin. Mitä monimutkaisempiin menetelmiin mennään, sitä enemmän vaaditaan myös laskentamalleilta. Vaativimmissa syväoppimisen hankkeissa (deep learning) käytetään neuroverkoiksi kutsuttuja malleja, jotka jäljittelevät ihmisaivojen rakennetta ja tapaa käsitellä dataa.

Koneoppimisen kolme päätyyppiä

Koneoppimisen erilaiset paradigmat voi jakaa karkeasti kolmeen luokkaan: ohjattuun, ohjaamattomaan ja vahvistusoppimiseen. Käydään ne läpi seuraavaksi.

Ohjattu oppiminen

Ohjatussa oppimisessa laskentamalli oppii tietyn kaavan, jossa tapahtumasta seuraa aina toinen tapahtuma. Voit verrata ohjattua oppimista koiran kouluttamiseen. Kun murre saa tietyn tempun jälkeen herkullisen nappulan, se lopulta oppii yhdistämään “syötteen” haluttuun “tulokseen”.

Luokittelumallit pyrkivät ennustamaan kategorian datapisteen piirteiden perusteella. Esimerkiksi asiakkaiden tekemien palvelupyyntöjen parametrien perusteella voidaan tehdä ennuste siitä, mihin pyyntö kannattaa organisaatiossa ohjata.

Regressiomallit puolestaan pyrkivät ennustamaan numeerisen ulostulon sisäänmenoarvojen perusteella. Esimerkiksi asunnon realistinen myyntihintahaarukka voidaan ennustaa asunnon piirteiden perusteella.

Jos haluat hyödyntää ohjattua oppimista, datastasi pitää löytyä sekä syötteitä, eli tietynlaista sisältöä, että mahdollisuus etukäteen määriteltyihin tuloksiin. Mallin pitää siis pystyä oppimaan, että jos x, niin y.

Ohjatun oppimisen mallit ovat monipuolisia ja tarkkoja, jos dataa on riittävästi ja algoritmit jiirissä. Niiden suorituskyky on kuitenkin erityisen herkkä datan laadulle.

Ohjaamaton oppiminen

Ohjaamaton oppiminen on koneoppimisen tyyppi, jossa malli tekee tulkintoja datan rakenteesta itsenäisesti, ilman ohjausta. Erona ohjattuun oppimiseen, ohjaamattomassa oppimisessa opetusvaiheessa ei tarvita ennalta määriteltyjä kategorioita tai lopputuloksia.

Klusterointi jakaa datapisteet ryhmiin niiden samankaltaisuuden perusteella. Näin voit löytää esimerkiksi asiakasryhmiä, joilla on samankaltaisia toiveita tai odotuksia.
Anomalioiden eli poikkeamien tunnistaminen auttaa huomaamaan vaikkapa laitteiden toimintahäiriöt, kuten hidastelun tai liiallisen tärinän, ajoissa.
Dimensioiden eri datan eri ulottuvuuksien vähentäminen helpottaa löytämään ominaisuudet hälyn keskeltä.

Ohjaamattoman oppimisen vahvuus on piilotettujen ilmiöiden näkemisessä. Liiketoimintasovelluksissa se voi auttaa rakentamaan kilpailuetuja, joista muut vasta haaveilevat. Menetelmää voi myös soveltaa laajaan dataan, jota on vaikea jäsentää ennalta.

Ohjaamattoman oppimisen tulosten tulkinta saattaa vaatia paljonkin asiantuntijaymmärrystä, jotta tuloksia saadaan hyödynnettyä maksimaallisesti, mutta usein tulokset ovat jo itsessään selitysvoimaisia ja käyttökelpoisia.

Vahvistusoppiminen

Vahvistusoppiminen on eräänlainen hybridi ohjatusta ja ohjaamattomasta oppimisesta. Mutta toisin kuin ne, vahvistusoppiminen hyödyntää palautetta päästäkseen koko ajan toimivampaan lopputulokseen.

Valmiit esimerkit oikeista ja vääristä vastauksista ovat hyviä opasteita vahvistusoppivalle mallille. Niiden lisäksi malli voi etsiä rakenteita datasta itsenäisesti. Vahvistusoppimismalli on kuin luonnossa kasvava eläimen poikanen, joka toimii ympäristössä ilman valmiita ohjeita, välillä esimerkkiä seuraten ja välillä pelkästään kokeillen. Se oppii parhaat toimintatavat yrityksen ja erehdyksen kautta.

Vahvistusoppiminen sopii monimutkaisiin ongelmiin, joissa mahdollisia tiloja ja toimintoja riittää vaikka muille jakaa. Monimutkaisten ympäristöjen mallintaminen ja tekoälyä ohjaavien palkkioiden määrittely vaatii kuitenkin paljon asiantuntemusta.

Parhaimmillaan vahvistusoppiminen voi kuitenkin tehostaa merkittävästi esimerkiksi suositusalgoritmien toimintaa ja lyhentää asiakastestauksen syklejä liki olemattomiksi.

Mitä on MLOps?

MLOps eli Machine Learning Operations tarkoittaa koneoppimismallien ylläpitoa ja optimointia tuotantoympäristössä. Jatkuvan kehityksen tiimiltä vaaditaan perinteisen DevOpsin lisäksi Data Science -osaamista, eli ymmärrystä datasta sekä koneoppimisen prosesseista ja malleista.

Tavoitteena on varmistaa, että koneoppiminen tekee juuri sitä mitä pitää, eli tuottaa arvoa liiketoiminnalle.

MLOps on jatkuvaa tekemistä, jossa kehitystiimi:

tunnistaa ja korjaa datan puutteita
varmistaa, että data on ajantasaista
tutkii tuloksia ja säätää parametreja
mittaa ja raportoi suorituskykyä.

Voiko koneoppimista soveltaa turvallisuuskriittisissä, suljetuissa ympäristöissä?

Koneoppimisen eri muotoja voi ottaa käyttöön myös korkean turvatason organisaatioissa, joiden IT pyörii kokonaan tai osittain suljetuissa ympäristöissä. Tietoturvan varmistaminen vaatii kuitenkin huolellista suunnittelua. Jokaisella toimialalla on omat riskinsä, joita pitää torjua tekoälyprojektin alkumetreiltä asti.

Oman koneoppimismallin rakentaminen on turvallinen tapa tuoda tekoäly osaksi liiketoimintaa. Kontrolli tietoturvaan pysyy täysin omissa käsissä, eikä mukautuksista tarvitse tinkiä. Vaihtoehto on kuitenkin selvästi työläämpi kuin valmiiden ratkaisujen hyödyntäminen. Valmiiden mallien takana on usein laaja opetusdata ja laskentatehoa, jota on vaikea saavuttaa yksin.

Tietoturvallisia, valmiita työkaluja ja menetelmiä on saatavilla sekä suurten pilvipalveluntarjoajien että avoimen lähdekoodin yhteisöjen kehittäminä. Niiden joukosta voi tarkalla harkinnalla löytää nappivaihtoehdon, joka vastaa koviinkin turvallisuusvaatimuksiin.

Kaikki palautuu jälleen dataan. Jos osa organisaation datasta on tiukemmin turvasuojattua kuin muu data, ketteriä kokeiluja voi lähteä edistämään siellä, missä valmiiden työkalujen käyttö on helpompaa.

Joskus arkaluontoisen, turvallisuuskriittisen datan käsittely onnistuu ainoastaan suljetussa ympäristössä, alusta asti itse rakentamalla. Tehoa projektiin voi hakea silloin esimerkiksi yhdistämällä voimia eri organisaatioiden kanssa. Varsinkin julkisella sektorilla yhteistyössä on paljon käyttämätöntä potentiaalia.

Lue myös: Tekoäly turvallisuuskriittisissä ympäristöissä

Kuusi askelta oppivien tekoälymallien hyödyntämiseen:

Määrittele käsillä oleva liiketoimintaongelma tarkasti, jotta voit konseptoida, millainen ratkaisu siihen voisi toimia.
Tutki käytettävissä olevaa dataa. Onko sitä riittävästi, onko sen laatu hyvää ja millaisessa muodossa data on?
Vertaile teknisen toteutuksen vaihtoehtoja ja tee asiantuntijoiden kanssa realistinen suunnitelma, jotta saat investoit kehitystyöhön järkevästi ja ROI on kohdillaan.
Varmista, että tiimistä löytyy tekoälyosaamisen lisäksi näkemystä tietoturvallisesta sovelluskehityksestä.
Ota käyttöön tarkoitukseen sopivimmat työkalut ja menetelmät.
Aloita ensimmäiset kokeilut, palaa iteroimaan ja toista sen jälkeen jatkuvan kehityksen (MLOps) hengessä.