Az OpenAI bemutatja a Sorát, egy olyan mesterséges intelligenciát, amely szemet gyönyörködtető videókat készít

Tavaly áprilisban a Runway AI nevű New York-i startup olyan technológiát mutatott be, amely lehetővé teszi az emberek számára, hogy videókat készítsenek, például egy tehénről a születésnapi bulin vagy egy kutyáról, aki okostelefonon beszél, egyszerűen egy mondat beírásával a számítógép képernyőjén.

A négy másodperces videók elmosódottak, szaggatottak, torzak és bosszantóak voltak. De ez egyértelmű jele volt annak, hogy az AI-technológiák egyre lenyűgözőbb videókat fognak generálni az elkövetkező hónapokban és években.

Alig tíz hónappal később a San Francisco-i induló OpenAI bemutatott egy hasonló rendszert, amely olyan videókat készít, amelyek úgy néznek ki, mintha egy hollywoodi filmből vették volna őket. A demonstráció rövid videókat tartalmazott – percek alatt – a havas réten ügető gyapjas mamutokról, az olvadó gyertyát bámuló szörnyetegről, valamint egy olyan jelenetről egy tokiói utcában, amelyet látszólag a városon átsuhanó kamera rögzített.

Az OpenAI, a chatbot ChatGPT és a DALL-E állókép-generátor mögött álló vállalat számos olyan cég közé tartozik, amelyek az ilyen típusú azonnali videógenerátorok fejlesztéséért küzdenek, beleértve az olyan startupokat, mint a Runway, valamint olyan technológiai óriásokat, mint a Google és a Meta, a Facebook és az Instagram tulajdonosa. Ez a technológia felgyorsíthatja a tapasztalt filmesek munkáját, miközben teljesen kiváltja a kevésbé tapasztalt digitális művészeket.

Gyors és olcsó módja is lehet a félretájékoztatás online létrehozásának, ami megnehezíti az online valóság megismerését.

„Teljesen félek attól, hogy ez a fajta dolog hatással lesz egy szűk vitás választásra” – mondta Oren Etzioni, a Washingtoni Egyetem mesterséges intelligenciára szakosodott professzora. Alapítója a True Media non-profit szervezetnek is, amely a politikai kampányokban előforduló online félretájékoztatás azonosítására törekszik.

Az OpenAI az új rendszerét Sorának nevezi, a japán ég szó után. A technológia mögött tevékenykedő csapat, köztük Tim Brooks és Bill Peebles kutatók azért választották ezt a nevet, mert „a korlátlan kreatív potenciál gondolatát idézi”.

READ A macskák, kutyák és az abortusz véleménye

Egy interjúban azt is elmondták, hogy a cég még nem hozta nyilvánosságra a Sorát, mert még dolgozik a rendszer kockázatainak megértése érdekében. Ehelyett az OpenAI megosztja a technológiát akadémikusok és más külső kutatók egy kis csoportjával, akik „vörös csapatot” alkotnak, ez a kifejezés arra utal, hogy keresik a visszaélés módját.

„Az a cél, hogy bepillantást engedjünk a láthatáron lévő dolgokba, hogy az emberek lássák ennek a technológiának a képességeit, és visszajelzést kaphassunk” – mondta Dr. Brooks.

Az OpenAI már vízjeleket helyez el a rendszer által készített videókon, amelyek AI által generáltként azonosítják őket, de a vállalat elismeri, hogy eltávolíthatók. Azt is nehéz lehet felismerni. (A New York Times „Generated by AI” vízjeleket adott a történetet tartalmazó videókhoz.)

A rendszer a generatív mesterséges intelligencia példája, amely szöveget, képeket és hangokat tud a helyszínen generálni. A többi generatív AI-technológiához hasonlóan az OpenAI rendszer is a digitális adatok – jelen esetben a videók és a videók tartalmát leíró feliratok – elemzésével tanul.

Az OpenAI nem volt hajlandó megmondani, hogy a rendszer hány videót tanult meg, és honnan származik, kivéve azt, hogy a képzés nyilvánosan elérhető videókat és a szerzői jogok tulajdonosaitól származó videókat tartalmazott. A cég keveset mond a technológiájának betanításához felhasznált adatokról, valószínűleg azért, mert meg akarja őrizni előnyét a versenytársakkal szemben – és többször is beperelték szerzői joggal védett anyagok felhasználása miatt.

(A New York Times decemberben beperelte az OpenAI-t és partnerét, a Microsoftot, az AI-rendszerekkel kapcsolatos hírtartalmak szerzői jogainak megsértésére hivatkozva.)

Sora olyan rövid leírásokra reagálva készít videókat, mint például „a korallzátonyok pompás papírból készült világa, tele színes halakkal és tengeri élőlényekkel”. Bár a videók lenyűgözőek lehetnek, nem mindig tökéletesek, és furcsa és logikátlan képeket is tartalmazhatnak. Például a rendszer nemrégiben készített egy videót arról, hogy valaki sütit eszik – de a süti soha nem lett kisebb.

READ Az Atlus az eShop bezárása előtt lemondta a "végső" 3DS játék értékesítését

A DALL-E, a Midjourney és más állóképgenerátorok olyan gyorsan fejlődtek az elmúlt néhány évben, hogy mára olyan képeket készítenek, amelyek szinte megkülönböztethetetlenek a fényképektől. Ez megnehezítette a téves információk online azonosítását, és sok digitális művész panaszkodik, hogy ez megnehezítette számukra az álláskeresést.

„Mindannyian nevettünk 2022-ben, amikor a Midjourney először megjelent, és azt mondta: „Ó, ez aranyos.” – mondta Reid Southin, a film michigani székhelyű koncepcióművésze. „Most az emberek elveszítik a munkájukat a Midjourney miatt.”

Imre Kertész

Imre Kertész az Androbit szerzője, aki hírekkel, politikával, üzleti témákkal, technológiával, sporttal, szórakozással és életmóddal foglalkozik. Célja, hogy közérthető, hasznos és megbízható információkkal segítse az olvasókat az aktuális események és fontos témák követésében.

A RedMagic hivatalosan is megerősítette új csúcskategóriás OLED gamer táblagépének globális érkezését

A OnePlus új részleteket árult el a kedvező árú Turbo 6X Pro okostelefonról

A Lenovo kedvezőbb árú, 16 hüvelykes ThinkPadet mutatott be Panther Lake processzorral és akár 32 GB RAM-mal

Apple okosgyűrű fejlesztésén dolgozhat – érkezhet az iRing

A RedMagic hivatalosan is megerősítette új csúcskategóriás OLED gamer táblagépének globális érkezését

Az iPhone-ok árának emelkedése egyre valószínűbb, szakértők szerint csak idő kérdése a drágulás

18 év után új Spyro-játék érkezik, erős Xbox-felhozatallal robbant a nyári showcase

Vélemény, hozzászólás? Válasz megszakítása

More Stories

A RedMagic hivatalosan is megerősítette új csúcskategóriás OLED gamer táblagépének globális érkezését

A OnePlus új részleteket árult el a kedvező árú Turbo 6X Pro okostelefonról

A Lenovo kedvezőbb árú, 16 hüvelykes ThinkPadet mutatott be Panther Lake processzorral és akár 32 GB RAM-mal

You may have missed

Apple okosgyűrű fejlesztésén dolgozhat – érkezhet az iRing

A RedMagic hivatalosan is megerősítette új csúcskategóriás OLED gamer táblagépének globális érkezését

Az iPhone-ok árának emelkedése egyre valószínűbb, szakértők szerint csak idő kérdése a drágulás

18 év után új Spyro-játék érkezik, erős Xbox-felhozatallal robbant a nyári showcase