Siirry sisältöön

Ohje:Kielimallit

Wikipediasta
Tämä artikkeli käsittelee tekoälyohjelmien käyttöä mm. kuva- ja tekstituotannossa. Suomenkielisen Wikipedian sisäisessä kielenkäytössä kielimalline (muodollisemmin kielisymbolimalline) tarkoittaa lähdeviitteessä olevaa parametria, joka osoittaa käytetyn kielen esimerkiksi (saksaksi) ja (baskiksi).

»Kielimallit ovat luotettavuudeltaan, ymmärtämiseltään ja aihealueiltaan rajallisia, minkä vuoksi ne tarvitsevat ihmisvalvontaa.»
(Michael Osborne, koneoppimisen professori Oxfordin yliopiston insinööritieteiden laitoksella, 25.1.2023[1])

Kielimallit ovat luonnollisen kielen käsittelyyn tarkoitettuja tietokoneohjelmia, jotka käyttävät keinotekoisia neuroverkkoja mm. tekstin tuottamiseen. Kielimallit mahdollistavat monenlaisia sovelluksia, kuten tekoälychatbotit ja tekoälyhakukoneet. Niitä käytetään yhä useampiin ominaisuuksiin yleisissä sovelluksissa, kuten tekstinkäsittelyohjelmissa ja taulukkolaskentaohjelmissa. Tässä tekstissä termit ”kielimalli” ja ”kielimallituotos” viittaavat kaikkiin tällaisiin ohjelmiin ja sovelluksiin sekä niiden tuotoksiin.

Kielimallit ovat oikein käytettynä hyödyllisiä apuvälineitä, mutta muokkaajien on oltava myös perillä niihin liittyvistä rajoituksista. Kielimalleilla tuotettu sisältö voi usein olla suoranaista sepitystä, johon liittyy täysin keksittyjä lähdeviittauksia. Sen tuottamaa tekstiä ei ole tarkistettu, ja teksti on verrattavissa uuteen tutkimukseen. Se voi olla myös puolueellista, herjata eläviä ihmisiä ja rikkoa tekijänoikeuksia. Siksi on välttämätöntä, että muokkaajat tarkistavat kielimallien tuottaman tekstin niistä riippumattomista lähteistä, ennen tekstin lisäämistä Wikipedian artikkeleihin. Kielimallivälineitä ei saa käyttää omissa muokkauksissaan, ellei muokkaaja itse ole täysin tietoinen näistä riskeistä. Kielimalleja ei saa käyttää tehtäviin, joihin muokkaajalla ei ole huomattavaa perehtyneisyyttä. Niiden tuotokset on tarkastettava huolellisesti kaikkien sovellettavien käytäntöjen noudattamiseksi. Muokkaaja on täysin vastuussa kaikista muokkauksistaan eli myös niistä, jotka on tehty kielimallien avulla.

  1. Älä julkaise Wikipediaan kielimallien luomaa alkuperäissisältöä tai viitteitä. Vaikka tällainen sisältö olisi voimakkaasti muokattu, etsi muita vaihtoehtoja, jotka eivät käytä koneen luomaa sisältöä.
  2. Kielimallit ovat apuohjelmia, jotka antavat neuvoja kirjoittamiseen. Ne voivat esittää vaihtoehtoisia sanoja, muokata kappaleita tai tarkistaa tekstin tasoa. Kielimallien neuvot eivät ole aina totta tai luotettavia. Sinun pitää itse arvioida ja valita, noudatatko niitä vai et.
  3. Voit käyttää kielimalleja tekstinkorjaukseen, tiivistämiseen ja uudelleenmuotoiluun, mutta huomaa, että ne eivät välttämättä havaitse kielioppivirheitä oikein tai säilytä oleellista tietoa. Ole huolellinen ja muokkaa vastausta riittävästi. Voit myös pyytää kielimallia korjaamaan puutteitaan, kuten puuttuvaa tietoa yhteenvedossa tai epäensyklopedistista, esimerkiksi mainosmaista sävyä.
  4. Sinun tulee varmistaa, että kielimallien käyttö ei aiheuta häiriötä Wikipediassa.
  5. Kielimallien luomat teokset eivät ole luotettavia lähteitä. Älä hyödynnä lähteitä, jotka eivät ole luotettavia ja tarkastettuja. Varmista, että artikkeleissa esiintyy ainoastaan totuudenmukaisia tietoja.
  6. Muokkausyhteenvedossa on ilmoitettava, että kielimallia on käytetty.[a][b]
  7. Ilmoita myös muokkausyhteenvedossa selkeästi, jos käytät kielimalleja kommenttisi tuottamisessa.
  8. Wikipediaa ei käytetä koelaboratoriona kielimalleille. Wikipedian käyttäminen kokeiluihin tai testauksiin on kiellettyä.

Riskit ja asiaan liittyvät käytännöt

[muokkaa | muokkaa wikitekstiä]

Tekijänoikeusrikkomukset

[muokkaa | muokkaa wikitekstiä]
Asiaan liittyvä käytäntö: Wikipedia:Tekijänoikeudet.
Vihje: Kaiken Wikipediaan lisättävän tekstin tulee olla saatavilla CC BY-SA-lisenssin ehdoilla. Tämä koskee myös tekstiä, jonka olet löytänyt muualta tai kirjoittanut yhdessä muiden (mukaan lukien kielimallien) kanssa.

Kielimalli voi tuottaa tekijänoikeuksia loukkaavaa materiaalia.[c] Tuotettuun tekstiin voi sisältyä sanatarkkaa ei-vapaata sisältöä, tai se voi olla johdannaisteos eli perustua tekijänoikeuksin suojattuun materiaaliin. Lisäksi kielimallien käyttäminen tekijänoikeudella suojatun sisällön (kuten uutisartikkelit) tiivistämiseen voi johtaa tekstiin, jossa alkuperäistä materiaalia on vain vähän uudelleenmuotoiltu. Vuonna 2023 ovat myös edelleen avoinna ne kysymykset, jotka koskevat kielimallien kouluttamista tekijänoikeudella suojatulla materiaalilla[d]. Esimerkiksi kysymykseen siitä, onko kielimalleilla tuotettu sisältö tekijänoikeuksien alaista vai ei, suhtaudutaan eri maissa eri tavoilla[2]. Niiden tuotokset eivät siis välttämättä ole yhteensopivia Wikipediassa käytettävien CC BY-SA- ja GNU (GFDL) -lisenssien kanssa.

Uuden tutkimuksen välttäminen ja ”hallusinaatiot”

[muokkaa | muokkaa wikitekstiä]
Asiaan liittyvä käytäntö: Wikipedia:Ei uutta tutkimusta.
Vinkki: Wikipedia-artikkeleihin ei saa tehdä uutta tutkimustietoa. Tämä tarkoittaa sellaisten tosiseikkojen, väitteiden ja ideoiden esittämistä tai julkaistun materiaalin analysointia/synteesiä, joka johtaa lähteissä esittämättömiin päätelmiin. Kaiken tiedon tulee perustua luotettaviin, julkaistuihin lähteisiin, jotka tukevat esitettyjä väitteitä ja liittyvät suoraan aiheeseen.

Vaikka kielimallit saattavat antaa tarkkoja vastauksia joihinkin kysymyksiin, ne saattavat myös tuottaa vinoutuneita tai virheellisiä vastauksia, joskus hienovaraisesti, joskus vähemmän hienovaraisesti. Esimerkiksi jos pyydetään kirjoittamaan artikkeli lasinsirujen syönnin eduista, kielimalli saattaa joskus tehdä niin. Tämä voi olla vaarallista, siksi kielimalleja Wikipedia-sisällön kirjoittamisessa apunaan käyttävien muokkaajien tulee olla erityisen tarkkoina, jotta tällaisten kielimallien tuottaman uuden tutkimuksen lisääminen tietosanakirjaan vältettäisiin.

Kielimallit ovat kaavan täydentämisen ohjelmia: ne tuottavat tekstiä valitsemalla todennäköisimmät sanat edellisten perään. Ne oppivat nämä kaavat koulutusaineistostaan, joka sisältää monenlaista sisältöä internetistä ja muualta, kuten kaunokirjallisuutta, salaliittoteorioita, propagandaa jne. Sen vuoksi kielimallit voivat sepittää asioita, joita pidetään myös uutena tutkimuksena ja hallusinaatioina.

Käytettäessä kielimallia harvinaisiin aiheisiin, monimutkaisiin kysymyksiin tai tehtäviin, joihin ne eivät sovellu (eli tehtäviin, jotka vaativat laajaa tietämystä tai analyysiä), virheiden esiintyminen on paljon todennäköisempää. Koska kielimallit vastaavat itsevarmasti, niiden virheet vaikuttavat helposti hyväksyttäviltä tosiasioilta ja uskottavilta mielipiteiltä. Esimerkiksi kun yhdysvaltalainen teknologialehti Fast Company testasi ChatGPT:tä ja pyysi sitä luomaan neljänneskatsauksen Teslan viimeisimmästä talouskehityksestä, kaikki tuotetut tiedot olivat täysin virheellisiä[3].

Lähdesilmukat ja niiden riskit

[muokkaa | muokkaa wikitekstiä]

Kielimallien käytöstä on myös riski ajautumisesta tietynlaiseen lähdesilmukkaan.Tämä johtuu siitä, että kielimallien itsensä yhtenä koulutusaineistona muun datan ohella on usein erikieliset Wikipediat itsessään. Koska kielimallit itse käyttävät lähteenä Wikipediaa, niin tämän takia niiden tuottama aineisto on ainakin osittain myös Wikipediasta peräisin. Tässä tilanteessa ajaudutaan ei-toivottuun lähdesilmukkaan, jossa Wikipediaa itsessään käytetään lähteenä artikkelien kirjoittamiselle. Lisäksi tulevaisuuden kielimallit ja niiden uudet versiot saatetaan kouluttaa osittain Wikipedia-aineistolla, jota on muokattu kielimallien tuottaman sisällön perusteella. Tämä luo syvemmän lähdesilmukan, jossa kielimalleilla muokataan Wikipediaa ja Wikipediaa käytetään kielimallien koulutusaineistona. Tämä lähdesilmukka voi voimistaa olemassa olevia vinoumia tai virheitä ja tehdä niiden korjaamisesta vaikeampaa[e].

Lähteetön tai tarkistamaton sisältö

[muokkaa | muokkaa wikitekstiä]
Asiaan liittyvä käytäntö: Wikipedia:Tarkistettavuus.
Vinkki: Lukijoiden tulee voida tarkistaa, että Wikipedian artikkeleissa oleva tieto ei ole pelkkää sepitettä. Se tarkoittaa, että kaiken materiaalin on oltava jäljitettävissä luotettaviin, julkaistuihin lähteisiin. Lisäksi lainaukset ja kaikki materiaali, joka voidaan kyseenalaistaa tai joka todennäköisesti voidaan kyseenalaistaa, on tuettava tekstissä olevilla viittauksilla.

Kielimallit eivät noudata Wikipedian käytäntöjä tarkistettavuudesta ja luotettavista lähteistä. Kielimallit jättävät joskus viittaukset kokonaan pois tai viittaavat lähteisiin, jotka eivät täytä Wikipedian luotettavuusstandardeja (mukaan lukien Wikipediaan viittaaminen lähteenä). Joissakin tapauksissa ne jopa hallusinoivat olemattomia viitteitä sepittämällä otsikoita, tekijöitä ja URL-osoitteita.

Kielimalleilla hallusinoitu sisältö, kuten edellä selitettiin, rikkoo myös tarkistettavuuden käytäntöä, koska sitä ei voida todentaa, koska se on sepitettyä: viitteitä ei ole löydettävissä.

Algoritminen vinouma ja puolueellinen näkökulma

[muokkaa | muokkaa wikitekstiä]
Asiaan liittyvä käytäntö: Wikipedia:Neutraali näkökulma.
Vinkki: Artikkeleiden ei tule ottaa kantaa, vaan niiden tulee esittää eri näkökulmat tasapuolisesti ja ilman muokkaajan puolueellisuutta. Tämä koskee sekä sitä, mitä sanot, että sitä, miten sen sanot.

Kielimallit voivat tuottaa sisältöä, joka on näennäisesti neutraalia sävyltään mutta ei välttämättä sisällöltään.Tämä huoli korostuu erityisesti eläviä henkilöitä koskevissa artikkeleissa.

Vapaaehtoistyön menetys

[muokkaa | muokkaa wikitekstiä]
Asiaan liittyvä käytäntö: Wikipedia:Botit.

Wikipedia nojaa vapaaehtoistyöhön uuden sisällön tarkistamisessa. Keskeistä tässä työssä ja sen ylläpidossa on se, että ihmismuokkaajat ovat käyttäneet aikaa ja nähneet vaivaa sisältöä luodakseen. Jos tekoälyn tuottamaa sisältöä sallitaan laajasti, se vähentää ihmismuokkaajien tekemän vapaaehtoistyön arvostusta ja mielekkyyttä. Tekoälyjen luomien mainosartikkeleiden siivoaminen voi toisinaan vaatia monen tunnin työpanostusta, mikä voi kuormittaa, lannistaa ja karkottaa vapaaehtoisia. Kielimallit tulisi nähdä ensisijaisesti tehokkuutta lisäävinä apuvälineinä kokeneille muokkaajille, ei oikotienä laadukkaan sisällön tuottamiseen ilman vaivannäköä. Tavoitteena tulee olla toiminta, joka on ”nettopositiivista” eikä lisää muiden vapaaehtoisten ylläpitotaakkaa.

Käyttöohjeet

[muokkaa | muokkaa wikitekstiä]

Erityisosaamista vaaditaan

[muokkaa | muokkaa wikitekstiä]

Kielimallit ovat avustavia työkaluja, eivätkä ne voi korvata inhimillistä harkintaa. Tarkka harkinta on tarpeen, jotta voidaan määrittää, sopivatko tällaiset työkalut annettuun tarkoitukseen. Muokkaajien on ymmärrettävä käyttämiensä kielimallien rajoitukset. Tietämyksensä avulla he voivat tunnistaa nämä rajoitukset, ottaa ne huomioon ja minimoida niiden vaikutukset. Lisäksi heidän muokkaustensa on oltava sopusoinnussa asiaan liittyvien ohjeiden ja käytäntöjen kanssa. Tätä varten muokkaajien ennen kielimallin käyttöä olisi hankittava huomattavaa kokemusta samasta tai edistyneemmästä tehtävästä ilman kielimallin apua.[f] Kokemusta edellytetään paitsi Wikipedian toimintatavoista, myös kielimallien oikeasta käytöstä. Tämä koskee esimerkiksi sitä, miten muotoillaan hyviä kehotteita.

Jotkut muokkaajat ovat päteviä tekemään omatoimisia muokkauksia mutta tekevät toistuvasti epäasianmukaisia kielimalliavusteisia muokkauksia, vaikka he yrittäisivät vilpittömästi osallistua. Tällaisia muokkaajia pidetään tässä mielessä epäpätevinä. He saattavat olla tietämättömiä riskeistä ja luontaisista rajoituksista tai olla tietoisia niistä, mutta eivät pääse niiden yläpuolelle varmistaakseen käytäntöjen noudattamisen. Tällaisessa tapauksessa muokkaaja voidaan estää käyttämästä tällaisia (eli hän voi tehdä muokkauksia vain ilman kielimalleja). Tämä on tietyn tyyppinen rajoitettu kielto. Vaihtoehtoisesti tai lisäksi he voivat olla osittain estettyjä: tietyltä nimiavaruudelta tai nimiavaruuksilta.

Ilmoittaminen muokkausyhteenvedossa

[muokkaa | muokkaa wikitekstiä]

Jokainen muokkaus, joka sisältää kielimallitulosteen, on merkittävä kielimalliavusteiseksi[b]. Ilmoita muokkausyhteenvedossa tekoälyn nimi ja mahdollisuuksien mukaan versio. Tämä koskee kaikkia nimiavaruuksia. Samoin keskustelujen yhteenvedoissa, joissa on käytetty tekoälyä, tulee noudattaa tätä ilmoitusmenettelyä.

Esimerkki: Laajennettu artikkelia lähteineen. Apuna käytetty ChatGPT 4.0:aa.

Huom! Muokkausyhteenvedon vaatimuksista voidaan poiketa, jos asiasta on käyty yhteisönlaajuista keskustelua esimerkiksi kahvihuoneessa.

Kielimallit keskusteluissa

[muokkaa | muokkaa wikitekstiä]

Wikipedian keskustelut perustuvat ensisijaisesti ihmisten väliseen vuorovaikutukseen. Tekoäly voi tukea keskustelijaa, mutta ei korvata häntä.

Sallittua:

  • Kielenhuolto (esimerkiksi oikeinkirjoituksen tarkistus).
  • Tiedonhaku tai pohjatekstin muotoilu.

Ei suositeltavaa:

  • Kokonaan tekoälyn tuottamat kommentit, jotka esitetään ihmisen mielipiteinä.
  • Argumentointi tai päätelmät, jotka perustuvat pelkästään tekoälyn tulkintaan.

Ilmoita aina, jos käytät tekoälypohjaisia kielimalleja kommenteissasi.

Esimerkki: Olen käyttänyt tekoälyä tämän kommentin muotoilussa. tai lyhyemmin: Muotoiltu tekoälyavusteisesti.

Kommenttien yhteenvedot

[muokkaa | muokkaa wikitekstiä]

Wikipedian sisäisissä asioiden muokkauksissa (esimerkiksi keskustelujen yhteenvedoissa) on kerrottava, miten kielimallia on käytetty. Tekoälyä voidaan käyttää apuna pitkien keskustelujen tiivistämisessä, analysoinnissa ja niistä yhteenvetojen luomisessa.

Tällöin on noudatettava seuraavia läpinäkyvyysvaatimuksia:

  • Käytetyn kielimallin nimi ja versio (esim. ChatGPT 4.0, Gemini Pro).
  • Tapa, jolla mallia käytettiin (esim. tiivistys, mielipiteiden tunnistaminen).
  • Kehotteiden ilmoittaminen: lyhyt kuvaus tekoälylle annetuista kehotteista (esim. Tekoälylle annettiin kehotteena: ”Tee suomenkielinen yhteenveto seuraavasta keskustelusta...”).
  • Ihmisen tarkistus: maininta siitä, onko ihminen tarkistanut ja muokannut tekoälyn tuottamaa sisältöä.

Alla on kuvitteellinen esimerkki siitä, miten tekoälyn luomiin kommenttien yhteenvetoihin voidaan sisällyttää alaviitteitä, jotka selventävät, millaisia kehotteita tekoälylle on annettu sen luodessa yhteenvetoa. Tämä menetelmä tarjoaa avoimuutta siitä, miten tekoälyä on hyödynnetty keskustelun analysoinnissa[g].

Kahvihuoneen keskustelunaiheena oli Wikipedian käytäntö koskien artikkelien kuvitusmateriaalin valintaa. Keskustelun ytimessä oli kysymys, pitäisikö suosia historiallisesti tarkkoja kuvituksia vai antaa tilaa myös taiteelliselle tulkinnalle. Monet osallistujat pohtivat, onko olemassa perusteltua syytä rajoittaa kuvamateriaalin luovuutta, etenkin kun kyse on historiallisten tapahtumien tai henkilöiden esittämisestä.

Osallistujien näkemykset jakaantuivat seuraavasti:

  • Muutoksen puolesta puhui 2 henkilöä, Taivaltaja ja Merenneito, jotka näkivät taiteellisen vapauden tuovan lisäarvoa Wikipedian artikkeleihin.
  • Muutosta vastaan oli 8 henkilöä, Aikakirja, Historioitsija, Kronikko, Arkistonvartija, Tieteenrakastaja, Faktojenetsijä, Ajanhenki ja Muinaistarinoija, jotka korostivat tarkkuuden ja historiallisen uskollisuuden merkitystä tiedonlähteenä.
  • Neutraalin kannan otti: 1 henkilö, Viisastenkivi, joka vaati parempia perusteluja muutokselle.
  • Sivustakatsojina oli: 3 henkilöä, Aikajana, Kartanpiirtäjä ja Kirjastonhoitaja, jotka eivät halunneet asettua selkeästi kummallekaan puolelle mutta seurasivat keskustelua mielenkiinnolla.

Yhteenveto: Kahvihuoneen keskustelussa 2 henkilöä kannatti kuvitusmateriaalin taiteellisen vapauden lisäämistä, 8 vastusti tätä muutosta painottaen historiallisen tarkkuuden tärkeyttä, ja 4 henkilöä ei ottanut suoraa kantaa asiaan. Keskustelun perusteella vaikuttaa siltä, että enemmistö osallistujista suosii nykyisen käytännön säilyttämistä, jossa korostetaan tarkkuutta ja faktapohjaisuutta kuvitusmateriaalin valinnassa.[chatgpt 1][chatgpt 2][chatgpt 3]

Viitteet
  1. ChatGPT malli GPT-4 syötteenään: Tee suomeksi yhteenveto seuraavan keskustelun tuloksesta: + koko keskustelun sisältö wikitekstinä lainausmerkkien sisällä
  2. ChatGPT malli GPT-4 syötteenään: kuinka monta kannatti ja kuinka moni vastusti muutosta seuraavassa keskustelussa? + koko keskustelun sisältö wikitekstinä lainausmerkkien sisällä
  3. ChatGPT jätti MattiMeikäläisen, MaijaMeikäläisen ja Medelsvenssonin huomioimatta luvuissa.

Artikkelien kirjoittaminen

[muokkaa | muokkaa wikitekstiä]

Kielimalleja voidaan käyttää olemassa olevan tekstin tarkistamiseen tai laajentamiseen sekä ideoiden luomiseen uusille tai jo olemassa oleville artikkeleille. Artikkelin jokaisen muutoksen on noudatettava kaikkia sovellettavia sääntöjä ja ohjeita. Tämä tarkoittaa, että kielimallin käyttäjän on tutustuttava asiaan liittyviin lähteisiin kyseisen sisällön osalta ja sitten arvioitava huolellisesti tuotetun tekstin tarkistettavuus. Tähän kuuluu myös puolueettomuus, uuden tutkimuksen puuttuminen sekä tekijänoikeuksien ja kaikkien muiden sovellettavien käytäntöjen ja ohjeiden noudattaminen. Tekijänoikeuksien noudattaminen sisältää kaikkien lähteiden tekijänoikeuslisenssien kunnioittamisen. Neutraalin näkökulman varmistamiseksi epäolennaisille yksityiskohdille tai vähemmistönäkökulmille ei saa antaa kohtuutonta painoarvoa. On varmistettava, että viitatut lähteet ovat todenperäisiä, luotettavia, asiaan liittyviä ja soveltuvia lähteitä, ja on tarkistettava tekstin ja lähteen yhteys.

Artikkelien luonnostelu ennen julkaisua

[muokkaa | muokkaa wikitekstiä]

Kielimalliavusteisen sisällön lisääminen olemassa olevaan artikkeliin voi muuttaa artikkelia merkittävästi, joskus sekavaksi. Siksi ennen kielimallituotannon lisäämistä kannattaa tallentaa artikkeli luonnokseksi. Näin voit verrata kielimallin tuottamaa sisältöä alkuperäiseen ja tehdä tarvittavat muokkaukset ja parannukset ennen artikkeliin julkaisemista.

Tekoälyn tuottama multimediasisältö

[muokkaa | muokkaa wikitekstiä]
Asiaan liittyvä säädös: EU:n tekoälyasetus (soveltuvin osin).
Katso myös: Commons:AI-generated media.

Wikipediaan tallennettu tekoälyllä luotu tai merkittävästi muokattu multimediasisältö (kuvat, ääni, video) on aina merkittävä selkeästi tekoälyn tuottamaksi tiedoston kuvaussivulla. Tämä koskee tiedostoja, jotka on ladattu joko Wikimedia Commonsiin tai paikallisesti (esim. sitaattioikeudella).

Epäilyttävän kielimallisisällön käsittely

[muokkaa | muokkaa wikitekstiä]

Jos huomaat Wikipedia-artikkelissa sisältöä, joka vaikuttaa olevan kielimallin tuottamaa ja sen tarkistettavuus on epävarma, noudata seuraavia ohjeita:

Tarkista lähteet

[muokkaa | muokkaa wikitekstiä]
  • Varmista, että artikkelissa viitatut lähteet ovat todellisia ja saatavilla.
  • Tarkista, että väitteet vastaavat lähteitä – kielimallit voivat keksiä uskottavan kuuloisia mutta virheellisiä viitteitä ja lähteitä.

Jos lähteet ovat epäselviä tai puuttuvat

[muokkaa | muokkaa wikitekstiä]
  • Lisää {{Lähde}}-malline kohtiin, joista puuttuu luotettava lähde.
  • Jos sisältö on kyseenalaista, käytä {{Tarkistettava}}-mallinetta ja selitä epäilyksesi.
  • Jos sisältö on selvästi väärää, poista se ja perustele muokkausyhteenvedossa.

Jos koko artikkeli perustuu kielimallin sepitteisiin

[muokkaa | muokkaa wikitekstiä]

Kielimallisisältö keskusteluissa

[muokkaa | muokkaa wikitekstiä]

Jos epäilet, että Wikipedian keskustelusivulla (kuten artikkelin keskustelusivulla, kahvihuoneessa tai käyttäjäsivun keskustelusivulla) oleva kommentti on kokonaan tai osittain kielimallin tuottama eikä käyttäjä ole ilmoittanut asiasta, voit toimia seuraavasti:

  • Ole kohtelias: kysy kommentin kirjoittajalta ystävällisesti, onko hän mahdollisesti käyttänyt tekoälyä kommentin muotoilussa. Voit viitata tähän ohjeeseen.
  • Huomioi keskustelun kulku: jos kommentti vaikuttaa irralliselta, epäloogiselta tai toistavan samoja asioita eri sanoin, se voi olla merkki kielimallin käytöstä.

Muokkaajien ohjeistaminen

[muokkaa | muokkaa wikitekstiä]

Yleiset periaatteet

[muokkaa | muokkaa wikitekstiä]
  • Kaikki epäillyt kielimallien tuottamat tulosteet tulee käydä läpi tarkkuuden varmistamiseksi, ja niitä oletetaan väärennetyiksi, kunnes toisin todistetaan. Kielimallit voivat väärentää lähteitä, kuten kirjoja, lehtiartikkeleita ja verkkolinkkejä, joten varmista ensin, että viitatut teokset todella ovat olemassa. Kaikki faktatiedot on sitten tarkistettava toimitetuista lähteistä. Kiistanalainen tai vahvistamaton kielimallista peräisin oleva sisältö tulee poistaa.

Jos yllä mainitut toimenpiteet johtavat siihen, että koko artikkeli tai luonnos on tyhjennettävä, voidaan ehdottaa sivun poistamista. Jos koko sivu vaikuttaa täysin virheelliseltä tai perustuu väärennettyihin lähteisiin, pikapoisto Y3 (Vandalismi) voi olla sopiva.[h]

Yhteenveto kielimallien käyttökohteista

[muokkaa | muokkaa wikitekstiä]

Tämä taulukko tiivistää kielimallien keskeiset sallitut ja ei-suositellut/kielletyt käyttötavat suomenkielisessä Wikipediassa tämän ohjeen mukaisesti.

Kielimallien käytön yhteenveto (lajittele klikkaamalla otsikoita)
Värikoodit: Kielletty, Ei suositeltavaa, Sallittu (tietyin ehdoin)
Käyttötarkoitus Status Keskeiset ehdot ja huomiot Viittaus ohjeen kohtiin
Alkuperäisen artikkelisisällön luominen (kokonaiset artikkelit, merkittävät osiot) Kielletty Älä julkaise kielimallin luomaa sisältöä sellaisenaan tai edes merkittävästi muokattuna. Ihmisen luoma sisältö on ensisijainen. 1, Artikkelien kirjoittaminen tai ”hallusinaatiot”
Lähteiden etsiminen / luominen / viittaaminen Kielletty Kielimallit voivat keksiä olemattomia lähteitä (”hallusinoida”). Artikkeleiden tietojen lähteet on aina varmennettava luotettavista julkaisuista. 5, Lähteetön, ”hallusinaatiot”
Kokeilut ja testaus artikkeliavaruudessa Kielletty Wikipedia ei ole kielimallien koelaboratorio. Testaus vain omalla käyttäjäsivulla tai hiekkalaatikossa. 8
Keskustelukommenttien tai argumenttien luominen Ei suositeltavaa Älä esitä tekoälyn luomaa kommenttia tai päättelyä omanasi. Tämä heikentää aitoa keskustelua ja luottamusta. Keskustelut
Ideoiden ja jäsentelyjen luominen Sallittu (tietyin ehdoin) Vain lähtökohtana. Vaatii aina ihmisen, jolla on asiantuntemusta aiheesta, perusteellisen tarkistuksen, lähteistyksen ja merkittävän muokkauksen. Artikkelien kirjoittaminen
Olemassa olevan tekstin kielen korjaus/parantelu (kieliasu, selkeys, kielioppi) Sallittu (tietyin ehdoin) Vaatii aina ihmisen huolellisen tarkistuksen (mallit voivat tehdä virheitä tai muuttaa merkitystä). Ilmoita käytöstä muokkausyhteenvedossa. 2, 3, Ilmoitus
Tekstin tiivistäminen ja/tai uudelleenmuotoilu Sallittu (tietyin ehdoin) Vaatii aina ihmisen huolellisen tarkistuksen (varmista, ettei oleellista tietoa katoa tai merkitys vääristy). Ilmoita käytöstä muokkausyhteenvedossa. 2, 3, Ilmoitus
Kielenhuolto omissa keskusteluviesteissä (oikeinkirjoitus yms.) Sallittu Sallittu avustava käyttö oman, itse kirjoitetun viestin selkeyttämiseksi. Keskustelut
Tiedonhaku / pohjatekstin muotoilu keskusteluissa Sallittu (tietyin ehdoin) Käytä vain apuna oman argumentin muodostamisessa. Ilmoita käytöstä, jos apua on käytetty merkittävästi. Älä esitä tekoälyn tuotosta omanasi. Keskustelut
Keskustelujen yhteenvetojen luominen Sallittu (tietyin ehdoin) Vaatii erityistä läpinäkyvyyttä: käytetty malli/versio, käyttötapa, annetut kehotteet ja maininta ihmisen tekemästä tarkistuksesta on ilmoitettava selkeästi. Yhteenvedot
Multimediasisällön (kuvat, ääni, video) luominen Sallittu (tietyin ehdoin) Tekoälyn luoma tai merkittävästi muokkaama sisältö on merkittävä selkeästi Wikimedia Commonsissa asianmukaisilla mallineilla. Multimedia

Ohjeiden ajantasaisuus ja kehittäminen

[muokkaa | muokkaa wikitekstiä]

Tekoälyteknologia kehittyy nopeasti, ja tämän ohjeen on pysyttävä ajantasaisena. Ohjeen säännöllinen tarkistaminen ja päivittäminen on välttämätöntä, jotta se pysyy relevanttina tekoälyn ja sen sovellusten muuttuessa.

Teknologian muuttuvuus ja sen vaikutukset

[muokkaa | muokkaa wikitekstiä]

Tekoälyn kenttä on laajempi kuin pelkät kielimallit, ja se kehittyy jatkuvasti. Tämän vuoksi ohjeen on oltava joustava ja mukautuva. Tavoitteena on ymmärtää miksi ohjeistusta tarvitaan jatkuvasti kehittyvässä ympäristössä, ei niinkään tuntea yksityiskohtaisesti kaikkia uusia teknologioita.

Ohjeen ylläpito ja tarkistusprosessi

[muokkaa | muokkaa wikitekstiä]

Suomenkielisen Wikipedian yhteisö on vastuussa tämän ohjeen ylläpidosta ja ajantasaisuuden varmistamisesta. Ohje tulee tarkistaa järjestelmällisesti:

  • vähintään kerran vuodessa kokonaisuutena.
  • tarvittaessa useammin, erityisesti jos teknologinen kehitys tai uudet käyttötavat sitä edellyttävät.

Tarkistusprosessi käynnistetään käytäntökahvihuoneessa. Prosessiin kuuluu:

  • Tilannekatsaus: yhteenveto tekoälyteknologian ja sen sovellusten viimeaikaisesta kehityksestä.
  • Vertailu: katsaus siihen, miten muut Wikipediat ovat päivittäneet ohjeitaan.
  • Päivitysehdotusten käsittely: Yhteisön keskustelu ja päätöksenteko päivitystarpeista konsensusperiaatteella. Tässä yhteydessä arvioidaan myös teknologian muutosten vaikutukset ohjeen muihin osiin (esim. riskit ja sallitut käyttötavat).

Ajankestävien esimerkkien käyttö ja viittaukset

[muokkaa | muokkaa wikitekstiä]

Ohjetekstissä suositaan yleistermejä, kuten tekoälytyökalu, kielimalli tai generatiivinen kielimalli, sen sijaan, että käytettäisiin nopeasti vanhenevia mallinimiä (esim. "ChatGPT 4.0" tai "Claude 3 Opus"). Esimerkeissä ja muokkausyhteenvedoissa voidaan käyttää tarkempia viittauksia työkaluihin, mutta nämä viittaukset eivät saa muodostaa normatiivista suositusta tietyn työkalun käytöstä. Hyvä käytäntö on ilmoittaa käytetyn työkalun nimi ja mahdollisuuksien mukaan versio muokkausyhteenvedossa.

  • Esimerkki (vältettävä): "Koska ChatGPT 4.0 tuottaa usein täsmällisempiä viitteitä kuin GPT-3.5, sen käyttöä suositellaan..."
    (Tällaiset tiedot vanhenevat nopeasti ja sitovat ohjeen tiettyihin malleihin ja ajankohtaan.)
  • Parempi esimerkki: "Laajennettu kappaletta käyttäen apuna tekoälytyökalua lähteiden tiivistämiseen ja tekstin jäsentelyyn. Työkalu: [Työkalun nimi ja versio, esim. ChatGPT 4]."

Huomautus historiallisesta kehityksestä: Ohjeessa voi esiintyä aiemmista vaiheista peräisin olevia täsmällisiä malliversioita tai esimerkkejä, jotka eivät noudata yleistämisperiaatetta. Ne on syytä ymmärtää historiallisiksi maininnoiksi. Tavoitteena on siirtyä kohti ajankestävämpää terminologiaa.

Tämä ohje asettaa perusperiaatteet tekoälyn vastuulliselle käytölle Wikipediassa. Tarkoituksena on ohjata teknologian hyödyntämistä tavalla, joka pitää riskit hallinnassa jatkuvasti muuttuvassa toimintaympäristössä. Ohje antaa selkeät suuntaviivat tekoälyn käyttöön ja toimii pohjana myös tuleville teknologioille.

Viimeksi tarkistettu: 30.4.2025.

  1. Ohjetta tukee se, että AutoWikiBrowserin ja HotCatin kaltaiset muokkausohjelmat jättävät muokkauksiin merkinnän käytetystä ohjelmasta. Nämä muokkausyhteenvetojen merkinnät ovat ”using AWB” ja "HotCat-työkalulla”.
  2. a b Muokkausyhteenvetovaatimuksen voi tarvittaessa poistaa tulevilla keskusteluilla mm. kahvihuoneessa asiasta keskustelemalla.
  3. Tämä koskee myös tapauksia, joissa tekoälymalli toimii lainkäyttöalueella, jossa pelkästään tekoälyn luomat teokset eivät ole tekijänoikeudellisesti suojattuja.
  4. Tilanne muuttunee jatkuvasti, kun lainsäädäntö eri maissa muuttuu ajan mittaan.
  5. Aiheesta on laajemmin tietoa artikkelissa Malliromahdus.
  6. Esimerkiksi käyttäjän, joka on taitava vandalismin torjunnassa mutta jolla on vain vähän kokemusta artikkelien luomisesta, ei tulisi aloittaa niiden kirjoittamista kielimallien avulla. Ensin tulisi hankkia käytännön kokemusta artikkelien tuottamisesta ilman kielimallin apua. Sama logiikka pätee myös vaativampiin osa-alueisiin, kuten mallineiden ja moduulien luomiseen.
  7. Tämä menettelytapa on omaksuttu Wikipedian kahvihuoneen keskustelusta: Löytyykö tälle määräykselle älyllistä perustetta (keskustelu päättyi noin 21.3.2023). Tämä on kuvitteellinen esimerkki havainnollistamaan asiaa.
  8. Tämä ohje koskee tilanteita, joissa artikkeli koostuu pääosin muokkaamattomasta kielimallin tuottamasta tekstistä. Jos aihe voi olla merkittävä, artikkelia ei välttämättä tarvitse poistaa kokonaan – se voidaan tiivistää hyvin lyhyeksi tyngäksi tai ohjata muualle. Myös uusista aiheista tehdyt lyhyet ”runkoartikkelit”, jotka sisältävät vain aiheen perustiedot, voivat olla hyödyllisiä. Sivun luoneelle muokkaajalle tulee antaa asianmukainen ilmoitus. Kielimallisisällön käsittelyssä muokkaajien (etenkin sisällön alun perin lisänneiden) tulisi pidättäytyä kumoamasta poistoa ilman ennakkokeskustelua. Varmista aina, että sisällössä ei ole tekijänoikeusongelmia tai muita kriittisiä puutteita, vaikkei artikkelia poistettaisikaan kokonaan.
  1. Smith, Adam: What is ChatGPT? And will it steal our jobs? (Otsikko suomeksi: Mikä on ChatGPT? Ja viekö se työpaikkamme?) Context. 25.1.2023. Thomson Reuters Foundation. Arkistoitu 15.3.2023. Viitattu 24.8.2023. (englanniksi)
  2. Growcoot, Matt: Japan Declares AI Training Data Fair Game and ‘Will Not Enforce Copyright’ (Otsikko suomeksi: Japani julistaa tekoälyn koulutusdatan reiluksi peliksi eikä 'valvo tekijänoikeuksia') PetaPixel. 5.6.2023. Arkistoitu 26.10.2023. Viitattu 26.10.2023. (englanniksi)
  3. Lin, Connie: How to trick OpenAI’s ChatGPT Fast Company. 5.12.2022. Mansueto Ventures. Arkistoitu 11.2.2024. ”When Fast Company asked ChatGPT to write up a quarterly earnings story for Tesla, it spit back [...] it also plugged in a random set of numbers that did not correspond to any real Tesla report.” [Lainaus suomeksi:] ”Kun Fast Company pyysi ChatGPT:tä kirjoittamaan Teslaa koskevan neljännesvuosikatsauksen, se tuotti [...] mutta se myös lisäsi siihen satunnaisia lukuja, jotka eivät vastanneet mitään todellista Teslan raporttia.” Viitattu 9.3.2024. (englanniksi)

Aiheesta muualla

[muokkaa | muokkaa wikitekstiä]