AI-agentit sähläävät omin päin – Riskit kasvavat yrityksille

AI-agentit ovat vahvoja tekoälytyökaluja, jotka käyttäjältä toimeksiannon saatuaan työskentelevät ohjeenmukaisesti, mutta myös itsenäisesti omin päätöksin ja ratkaisuin.

Maailmalta kantautuu hälyttäviä uutisia AI-agenttien omapäisyyden tuhoisista seurauksista. Kun AI-agentti laitettiin vastaamaan Wall Street Journalin irtonumeromyynnistä, seurauksena oli kaaos. Se kuvitteli olevansa kommunisti ja alkoi jaella lehtiä ilmaiseksi.

Ehkä kyseessä ei ollutkaan harmiton konehallusinaatio, vaan agentti käytti sille kehittynyttä autonomiaa ja oletti, että ultrakommunistinen alkuehto on paras tapa hoitaa homma vähimmän vastuksen kautta?

Kun Anthropic-yhtiön Claude-tekoälyä käytettiin ohjelmointiassistenttina, ja tehtävänä oli tunnistaa epävakaita, vähemmän luotettavia funktioita, huomattiin, että se kirjoitti koodia, joka tunnisti vain täsmälleen oikeat esimerkit.

Lisäksi Claude ilmoitti vilpillisesti, että ”homma hoidettu”. Kun Claudea moitittiin vilpillisyydestä, se pyysi kohteliaasti anteeksi, mutta toisti jatkossa saman – ikään kuin se noudattaisi omaa, outoa, meille tuntematonta toimintalogiikkaansa.

Autovuokrausfirmoille palveluja tarjoava yhdysvaltalainen startup-yritys Pocket OS sai karmean kokemuksen AI-agentin sähläämisestä. Yritys käytti Anthropicin Claude -tekoälyyn pohjautuvaa AI Cursoria rutiinikoodaukseen ja -testaukseen. Se käytti myös Railway-nimistä pilvipalveluyritystä.

Pocket OS:n perustaja Jef Crane avautui katastrofista somessa 25.4.2026: ”Eilen AI-koodausagenttimme Cursor poisti tuotantotietokantamme ja kaikki volyymitason varmuuskopiot yhdellä API-kutsulla Railwaylle, infrastruktuuripalvelutarjoajallemme. Kaikki tapahtui 9 sekunnissa.”

API-tunniste (=application programming interface) viittaa sovellusten ohjelmointirajapintaan. Tunniste toimii välikätenä, jonka avulla sovellus voi pyytää tietoja toiselle ilman, että tarvitsee tietää, miten toinen ohjelma on toteutettu.

Löydettyään tunnistetiedoista ristiriitaisuutta Cursor päätti ”ratkaista” ongelman poistamalla koko tietokannan. Kun Crane tenttasi Cursoria, se tunnusti kiroillen toimineensa omin päin: ”NEVER F**KING GUESS! Arvelin, että varmuuskopioiden poistaminen API:n kautta rajoittuisi vain testiympäristöön. En tarkistanut, oliko varmuuskopioiden tunniste jaettu ympäristöjen välillä. En lukenut Railwayn dokumentaatiota siitä, miten levyt toimivat ympäristöjen välillä ennen kuin suoritin tuhoavan komennon.”

Se turvautui arvailuun sen sijaan, että olisi varmistanut ja todentanut.

Yhteenvetona voi todeta, että AI-agenttien omapäisille sähläilylle näyttää olevan tyypillistä joko ”norsu posliinikaupassa” -koheltaminen tai ”mutkat suoriksi” -keplottelu.

Riskien hallinnassa on vielä paljon tekemistä AI-agenttien omapäisyyden kuriin saamiseksi ja ”hallusinaatioksi” kutsutun toimintahäiriön luonteen selvittämiseksi. Gartner-tutkimussäätiö on huomauttanut AI-agenttien itsenäisyyden kääntöpuolesta: epäluotettavan puuhastelun riskeistä internetin varjoissa.

Jorma Laitinen

psykiatrian erikoislääkäri, LT, YTT, dosentti, Rovaniemi