NIJE BAŠ SAVRŠENO

NEVJEROJATNA UMJETNA INTELIGENCIJA: Uz nekoliko riječi napravite svoj video

Autor Krunoslav Ćosić

OpenAI predstavlja AI model Sora koji može stvoriti realistične i maštovite scene iz tekstualnih uputa

Izvor: OpenAI

Tvrtka OpenAI, koja se krajem 2022. godine prva proslavila s umjetnom inteligencijom, od koje mnogi već zaziru i pitaju se što je sljedeće, napravila je veliku nadogradnju i sada nudi nešto što drugi ne nude. Na njihovoj web stranici možete vidjeti fotorealistični prikaz dva piratska broda koja plove u šalici kave ili čovjeka kako sjedi na oblaku i čita knjigu.

Izvor: OpenAI

Izvor: OpenAI

Korisnik samo treba napisati što b želio da se pojavi u videu, a zatim ih pretvara u složene scene s različitim likovima, a prikazat će se i određene vrste pokreta. Novi model video generiranja zove se Sora.

Sora može stvoriti realistične i maštovite scene iz tekstualnih uputa. Model omogućuje korisnicima stvaranje fotorealističnih videozapisa u trajanju do jedne minute, a sve na temelju upita koje su sami napisali. Nisu problem za stvoriti niti emocije likova u videu.

Kažu da je Sora sposobna stvoriti "složene scene s više likova, specifičnim vrstama pokreta i točnim detaljima subjekta i pozadine", kako piše na blogu OpenAI-ja. Zanimljivo je da model može razumjeti kako objekti postoje u fizičkom svijetu te precizno interpretirati rekvizite i generirati uvjerljive likove koji izražavaju živopisne emocije.

Izvor: OpenAI

I editiranje videa imat će koristi od novog OpenAI modela koji pretvara tekst u video jer će se frameovi koji slučajno nedostaju nadopuniti u videu za koji korisnik smatra da nije savršen. Uz to, Sora može generirati video na temelju fotografije.

Ipak, tehnologija pretvaranja teksta u video nije još savršena te se u prikazanim video filmovima, koji demonstriraju novu značajku, može primijetiti kako se primjećuju neki znakovi korištenja umjetne inteligencije. Iz OpenAI-ja kažu da se u složenim video scenama može dogoditi problem s točnom simulacijom određene scene. Ipak, rezultati su ipak poprilično impresivni.

Izvor: OpenAI

Sve je počelo generatorima teksta u slike, a nedavno se počeo poboljšavati i video. Tvrtke poput Runwaya i Pike pokazale su vlastite impresivne modele pretvaranja teksta u video, a Googleov Lumiere također se smatra jednim od glavnih konkurenata OpenAI-ja u ovom području.

Iako se sve više dodaju vodeni žigovi u fotografije izrađene uz pomoć umjetne inteligencije oni se mogu lako ukloniti, što priznaje i sam OpenAI tako da ćemo se u budućnosti svi zajedno boriti s posljedicama lažnih, ali fotorealističnih videa nastalih uz pomoć umjetne inteligencije, a koji će se na prvi pogled činiti pravima i realnima.