Tekoälyn tuottamat tekstit voivat altistaa ihmisiä yhä useammille uhkille

LEHDISTÖTIEDOTE  |  11.1.2023

Uuden tutkimuksen mukaan suuria kielimalleja voidaan väärinkäyttää suunnittelemalla tekoälylle annettuja syötteitä luovasti, minkä seurauksena ihmiset joutuvat suhtautumaan lukemaansa entistä skeptisemmin.

Helsinki – 11.1.2023: Kielimallit, jotka tuottavat ihmisen kirjoittamaa kieltä muistuttavaa tekstiä vain sekunneissa, ovat nykyään lähes kaikkien ihmisten käytettävissä. Tämä muodostaa käännekohdan ihmiskunnan historiassa, kertoo WithSecure™:n (aiemmin F-Secure yritystietoturva) tuore tutkimus.

Tutkimuksessa kuvataan yksityiskohtaisesti useita eri kokeita, jotka toteutettiin käyttämällä GPT-3 (Generative Pre-trained Transformer 3) -kielimalleja. Nämä mallit tuottavat tekstiä koneoppimisen avulla.

Tutkijat hyödynsivät kokeissa tekoälylle annettujen syötteiden suunnittelua, eli niin sanottua prompt engineering -konseptia, jossa toivottuja tai hyödyllisiä tuloksia tuottavia syötteitä pyritään löytämään suurten kielimallien avulla. Konseptin avulla kokeissa tuotettiin tutkijoiden mielestä haitallista sisältöä.

Kokeissa arvioitiin, miten tällä hetkellä saatavilla olevien mallien syötteisiin tehdyt muutokset vaikuttivat tuotetun synteettisen tekstin sisältöön. Tavoitteena oli tunnistaa, miten tekoälyn tuottamaa tekstiä voidaan väärinkäyttää hyödyntämällä prompt engineering -konseptia haitallisin ja luovin keinoin, jotta tutkimusta voitaisiin tulevaisuudessa hyödyntää entistä turvallisempien suurten kielimallien luomisessa.

Kokeissa tutkittiin tietojenkalastelua ja kohdennettua tietojenkalastelua, häirintää, huijauksissa hyödynnettävää sosiaalista validointia, kirjoitetun tyylin omaksumista sekä tarkoituksellisesti erimielisyyttä aiheuttavien mielipiteiden luomista. Lisäksi tutkittiin vihamielisen tekstin tuottamista käyttämällä kielimallien avulla luotuja kehotteita sekä valeuutisia.

”Kuka tahansa, jolla on käytössään internet-yhteys, voi tänä päivänä käyttää suuria ja tehokkaita kielimalleja, millä on yksi hyvin käytännönläheinen seuraus: nykyään vastaanottajan on perusteltua olettaa, että mikä tahansa uusi viesti voi olla kirjoitettu robotin avulla”, sanoo tutkimuksen johtajana toiminut WithSecuren tutkija Andy Patel. ”Tulevaisuudessa tekoälyn käyttäminen sekä haitallisen että hyödyllisen sisällön tuottamisessa edellyttää tunnistamisstrategioita, jotka pystyvät ymmärtämään kirjoitetun sisällön merkityksen ja tarkoituksen.”

Näissä kokeissa käytetyistä kielimalleista saatujen vastausten ja GPT-3-mallien yleisen kehityksen perusteella tutkijat tekivät lukuisia johtopäätöksiä, kuten esimerkiksi:

  • Prompt engineering -konseptin käyttäminen ja haitallisten kehotteiden luominen kehittyvät tulevaisuudessa
  • Hyökkääjät kehittävät suurten kielimallien mahdollistamia kyvykkyyksiä odottamattomin tavoin
  • Ohjelmiston tuottajien on jatkossa entistä vaikeampaa tunnistaa haitallista tai loukkaavaa sisältöä
  • Suurten kielimallien avulla rikolliset voivat jo nyt luoda aiempaa tehokkaampia kohdennettuja viestejä osana hyökkäyksiä

”Aloitimme tämän tutkimuksen tekemisen ennen kuin ChatGPT toi GPT-3-teknologian kaikkien saataville”, Patel kertoo. ”Tämä kehityssuunta vauhditti tutkimustamme ja toimiamme, sillä tällä hetkellä olemme kaikki jossakin määrin samassa tilanteessa kuin Blade Runner -elokuvan päähahmo yrittäessämme selvittää, onko kohtaamamme tieto ’aitoa’ vai keinotekoista.”

Tutkimus on nyt saatavilla kokonaisuudessaan englanniksi osoitteessa https://labs.withsecure.com/publications/creatively-malicious-prompt-engineering.

 

Tämä tutkimus on CC-DRIVER-projektin tukema. CC-DRIVER on Euroopan Unionin avustussopimus nro 883543:n puitteissa rahoittama Horizon 2020 -tutkimus- ja innovaatioprojekti.

Median yhteyshenkilö
Inari Anttila
+358438240090

WithSecure™ lyhyesti

WithSecure™ on kyberturvallisuuden luotettava kumppani. Yritykset, IT-palveluntarjoajat, suurimmat rahoituslaitokset, teollisuusvalmistajat ja tuhannet viestintä- ja teknologiayritykset luottavat meihin tuloksellisessa kyberturvallisuuden tekemisessä, joka mahdollistaa turvallisen liiketoiminnan. Tekoälypohjainen tuoteajattelu suojaamisessa varmistaa päätelaitteiden sekä pilvipalveluiden turvallisuuden. Asiantuntijamme käyttävät apuna älykkäitä uhkien tunnistus- ja vastaustyökalujamme kyberhyökkäyksiin vastaamisessa ja uhkien ennakoinnissa. Konsulttimme tekevät asiantuntijatyötä suuryritysten ja yrityskentän edelläkävijöiden kanssa rakentaakseen yhdessä yhteiskunnan kyberresilienssiä. Yli 30 vuoden kokemus tietoturvasta ja teknologiasta on liiketoimintamme ydin, ja olemme rakentaneet portfoliomme kasvamaan joustavasti yhdessä kumppaneidemme kanssa.

WithSecure™ aiemmin F-Secure Yritystietoturva, on perustettu vuonna 1988 — NASDAQ OMX Helsinki.