Hvorfor er tekst-til-video-tjenesten Sora så revolusjonerende?

Sora er den nyeste tjenesten fra OpenAI, selskapet som står bak tjenestene ChatGPT og Dall-e. Med Sora (som ennå ikke er åpnet for generell tilgang), tar de et stort sprang framover i kvalitet på tjenester som tar utgangspunkt i en tekst-prompt og lager en video av den, såkalt tekst-til-video AI.

Ung jente som tenker i videobilder

Bilde: istockphoto.com

Sora benytter naturligvis kunstig intelligens. OpenAI demonstrerer igjen at de er ledende i feltet når det gjelder kvalitet på sluttproduktet, og Sora er så langt foran konkurrentene at det er revolusjonerende i seg selv. Men faktum er at Sora også er så god at mange opplever det som ganske skremmende.

Vi diskuterte dette i livesendingen under: (Artikkelen fortsetter under videoen.)

 

Entusiaster og kritikere

Sora ble lansert fredag 16. februar 2024. Eksemplene som ble brukt på nettsiden for produktet fikk enkelte til å juble og andre til å fortvile.

Her er noen eksempler på responsen i artikkelforfatterens nyhetsfeed:

Reaksjoner på tekst-til-video-tjenesten Sora

Hovedresponsen her var positiv – til dels overveldende positiv – men enkelte kritiske røster stilte naturlig nok også spørsmål ved hva som skjer med jobbene til alle som lager video, skuespillere mm i en verden der slike tjenester finnes.

For mange yngre brukere, var imidlertid responsen vesentlig mer dyster. Her er noen skjermskudd fra min sønns nyhetsfeed (han er 28):

Her spares det altså ikke på dommedagserklæringene. “Legitimately horrifying”, “The internet era of information just ended, noe welcome to the new disinformation era” og “I don’t know how we’re going to survive this”, er bare tre eksempler av ganske mange.

Nå er jo ikke dette noen absolutte spådommer – det er en tilfeldig valgt gruppe Twitreres (“X’eres”?) reaksjoner på en tjeneste som altså er så god, at videoene knapt kan skilles fra virkelig video. Du kan se eksemplene selv på OpenAI sin side for Sora.

Deep fakes og desinformasjon

Og nettopp dette med kvaliteten er det som åpner for uendelige muligheter for misbruk i form av deep fakes, spredning av desinformasjon og liknende. Det er også på sin plass å spørre om den rollen video har som sannhetsvitne både i nyhetssendinger, i rettssaker og andre steder med dette faktisk er over. Om hvem som helst kan lage naturtro video med en enkel tekstprompt, blir det fort umulig å skille løgn fra fakta. Og informasjon fra desinformasjon.

Det er derfor smart av OpenAI å ikke slippe fri denne tjenesten for åpen bruk sånn helt med det samme. De sier selv på sin nettside at de arbeider med å motvirke skadelig bruk, blant annet ved å blokkere prompter som ber om “ekstrem vold, seksuelt innhold, hatefulle bilder, bruk av kjente personers utseende og andres opphavsrett.” (Se hele policy-beskrivelsen her.)

Lover under arbeid

Heldigvis er arbeidet i gang med lovtekster som skal begrense skadevirkningene til denne og andre AI-tjenester. EU sin “AI-act” forventes å bli vedtatt i løpet av året, og tilsvarende arbeid er i gang også mange andre steder.

I Norge har Nasjonal Strategi for Kunstig intelligens fra 2020 lagt gode føringer, men oppfølgingen har siden vært skuffende passiv. Det samme gjelder dessverre Forbrukerrådet, som har konkludert med at AI-bilder ikke behøver å merkes, slik retusjerte bilder må.

Det koker med andre ord ned til at vi må vente og se hva EU kommer opp med, og i mellomtiden fortsetter utviklingen som et ekspresstog. Med Sora er vi allerede der man bare for få måneder siden spådde at vi kanskje ville klare i 2025 og 2026, og dette går stadig raskere.

Mange spennende muligheter

For meg, som markedsfører og kommunikatør, er det imidlertid nesten umulig å ikke la seg rive med av alt som nå er blitt mulig! På konferansen AI-con 2024 presenterer vi mange smakebiter på nettopp dette. Og i det daglige simpelthen fryder jeg meg over å konne produsere blant annet bildet under med en kort og enkel tekst-prompt i ChatGPT 4 (som har Dall-e 3 integrert):

Prompten var: “Lag et bilde som skal illustrere invitasjoner til et rubinbryllup”. Bare det å kunne lage noe slikt på få sekunder er ganske sensasjonelt etter min mening. Og hvis du da tenker deg at Sora gjør det mulig å gjøre det samme, bare i form av video. Mulighetene er ganske grenseløse – både for bruk og dessverre også misbruk.

Men det er derfor Sora er så revolusjonerende – og det er derfor vi trenger ordentlig lovgivning på plass så snart som mulig.


Se KnowHouse sine kurs om kunstig intelligens (AI/KI)

Handlekurv