T, 29.11.2022

Vaata, kuidas tehisintellekt loob tekstist ulmelisi videoid!

Kaido Einama
, ajakirjanik
Vaata, kuidas tehisintellekt loob tekstist ulmelisi videoid!
Facebook Messenger LinkedIn Twitter
Comments
Meta täitis soovi: palun mulle video koerast, kes sööb rannas jäätist!
Meta täitis soovi: palun mulle video koerast, kes sööb rannas jäätist! Foto: ekraanipilt videost / Meta

Kui tekstist veidraid pilte genereerivaid tehisintellekte on juba tekkinud nagu seeni pärast vihma, siis Facebooki haldav Meta on nüüd oma iseõppiva masina pannud ka videoid tegema. Eile esitletud liikuvad pildid tunduvad veel sürrealistlikumad, kui robotite loodud fotod.

Meta teenus Make-a-video nõuab eelregistreerimist ning peale seda peaks tulevikus saama samamoodi tehisintellektile põhjalikke kirjeldusi saata, mille põhjal see siis video valmis meisterdab. Küsida võib kõike, ka täiesti absurdseid asju ning videoklippi pannakse kokku kasvõi mererannas käppade vahelt vahvlijäätist limpsiv koer või kentsakalt kõndivad noored inimesed vihmas (vaata näiteid siit).

Animatsiooni sujuvusega on AI-l veel tegemist, sest liikumine pole siiski päris loomulik. Supermani kostüümis ringi lendava koera puhul muidugi seda ei märka, sest me ei oska sellist vaadet nii ehedalt ette kujutada.

Süsteem kasutab õppimiseks andmebaasis olevaid pilte koos kirjeldustega, et saada teada, kuidas maailm välja näeb. Liikumise imiteerimiseks kasutatakse aga ilma märksõnadeta videoklippe, kust õpitakse, kuidas maailm liigub. Nende andmetega võimaldab Make-A-Video luua vaid mõne sõna või lausega üsna veidraid, kuid täiesti ainulaadseid videoid.

Praegusel demoleheküljel on näha erinevaid valikuid, mis stiilis videot võib tellida: sürrealistlikku, realistliku või mõne kunstistiili filtriga töödeldut. Kuid võib ette sööta ka tavalise pildi, näiteks on toodud animatsioon originaalmaalile mäsleval merel kulgevast purjekast. Tehisintellekt «mõtleb» videosse liikuvad tormilained juurde.

Paraku ei lasta veel kõiki külastajaid videosid genereerima, kuna see nõuab suurusjärgu võrra enam arvutiressurssi võrreldes piltide genereerimisega ning ligi lastakse vaid valitud seltskond, kellel tuleb enne vastav avaldus esitada. Postimees pole veel ligipääsu pärast taotlemist saanud, Meta pole ka lubanud, millal teenus kättesaadavaks muutub.

Meta tegevjuht Mark Zuckerberg nimetas eile välja tulnud tehisintellekti uut oskust järgmiseks tasemeks masina õpetamisel maailmast aru saama: «See on päris hämmastav edasiminek,» kirjutas ta. «Videot on palju raskem luua kui fotosid, sest lisaks iga piksli õigele genereerimisele peab süsteem ka ette ennustama, kuidas need aja jooksul muutuvad. Make-A-Video lahendab selle probleemi, lisades järelvalveta õppimise kihi, mis võimaldab süsteemil mõista liikumist füüsilises maailmas ja rakendada seda traditsioonilisel tekstist pildiks genereerimisel.»

Näiteid video loomisprotsessist.
Näiteid video loomisprotsessist. Foto: ekraanipilt / Meta AI

Milline on tulemus, kui tehisintellektil Make-A-Video lasta genereerida klipp teemal «Kuldne retriiver, kes sööb päikeseloojangul kaunil troopilisel rannal jäätist, kõrge eraldusvõimega» (ehk «A golden retriever eating ice cream on a beautiful tropical beach at sunset, high resolution»)?

Tulemus on selline:

Tehnikat, mida tehisintellekti treenimiseks kasutatakse, nimetatakse «Järelvalveta masinõppeks» ja seda on mujal rakendatud juba mõnda aega, kuid videote puhul antakse masinale ette suur hulk videoid ilma mingite selgituste ja sorteerimiseta, lastes algoritmidel endil välja selgitada seaduspärasused ja kaadritelt nähtava liikumise füüsika.

Meta pole siiski päris esimene, kes vastava teadustöö ja demo on avaldanud (teadustöö on allalaetav siit). Maikuus esitlesid Hiina teadlased samasugust tekstist-videoks lahendust nimega CogVideo. Nnende lahenduse näiteid saab vaadata sellest videost.

Lisaks positiivsetele arengutele tehisintellekti uute võimaluste osas on näiteks Washington Post juhtinud tähelepanu ka selliste lahenduste võimalikule negatiivsele küljele, sest nii saab näiteks tehnoloogia arenedes luua ka päris kvaliteetseid ning tegelikkusele äravahetamiseni sarnaseid süvavõltsinguid. Kas oskaksid vahet teha sellel Tiktoki süvavõltsingute kanalil olevatel võltsvideotel ja mõnel ehtsal Tom Cruise´ist tehtud videol?

Märksõnad
Tagasi üles