Tavaly áprilisban a Runway AI nevű New York-i startup olyan technológiát mutatott be, amely lehetővé teszi az emberek számára, hogy videókat készítsenek, például egy tehénről a születésnapi bulin vagy egy kutyáról, aki okostelefonon beszél, egyszerűen egy mondat beírásával a számítógép képernyőjén.
A négy másodperces videók elmosódottak, szaggatottak, torzak és bosszantóak voltak. De ez egyértelmű jele volt annak, hogy az AI-technológiák egyre lenyűgözőbb videókat fognak generálni az elkövetkező hónapokban és években.
Alig tíz hónappal később a San Francisco-i induló OpenAI bemutatott egy hasonló rendszert, amely olyan videókat készít, amelyek úgy néznek ki, mintha egy hollywoodi filmből vették volna őket. A demonstráció rövid videókat tartalmazott – percek alatt – a havas réten ügető gyapjas mamutokról, az olvadó gyertyát bámuló szörnyetegről, valamint egy olyan jelenetről egy tokiói utcában, amelyet látszólag a városon átsuhanó kamera rögzített.
Az OpenAI, a chatbot ChatGPT és a DALL-E állókép-generátor mögött álló vállalat számos olyan cég közé tartozik, amelyek az ilyen típusú azonnali videógenerátorok fejlesztéséért küzdenek, beleértve az olyan startupokat, mint a Runway, valamint olyan technológiai óriásokat, mint a Google és a Meta, a Facebook és az Instagram tulajdonosa. Ez a technológia felgyorsíthatja a tapasztalt filmesek munkáját, miközben teljesen kiváltja a kevésbé tapasztalt digitális művészeket.
Gyors és olcsó módja is lehet a félretájékoztatás online létrehozásának, ami megnehezíti az online valóság megismerését.
„Teljesen félek attól, hogy ez a fajta dolog hatással lesz egy szűk vitás választásra” – mondta Oren Etzioni, a Washingtoni Egyetem mesterséges intelligenciára szakosodott professzora. Alapítója a True Media non-profit szervezetnek is, amely a politikai kampányokban előforduló online félretájékoztatás azonosítására törekszik.
Az OpenAI az új rendszerét Sorának nevezi, a japán ég szó után. A technológia mögött tevékenykedő csapat, köztük Tim Brooks és Bill Peebles kutatók azért választották ezt a nevet, mert „a korlátlan kreatív potenciál gondolatát idézi”.
Egy interjúban azt is elmondták, hogy a cég még nem hozta nyilvánosságra a Sorát, mert még dolgozik a rendszer kockázatainak megértése érdekében. Ehelyett az OpenAI megosztja a technológiát akadémikusok és más külső kutatók egy kis csoportjával, akik „vörös csapatot” alkotnak, ez a kifejezés arra utal, hogy keresik a visszaélés módját.
„Az a cél, hogy bepillantást engedjünk a láthatáron lévő dolgokba, hogy az emberek lássák ennek a technológiának a képességeit, és visszajelzést kaphassunk” – mondta Dr. Brooks.
Az OpenAI már vízjeleket helyez el a rendszer által készített videókon, amelyek AI által generáltként azonosítják őket, de a vállalat elismeri, hogy eltávolíthatók. Azt is nehéz lehet felismerni. (A New York Times „Generated by AI” vízjeleket adott a történetet tartalmazó videókhoz.)
A rendszer a generatív mesterséges intelligencia példája, amely szöveget, képeket és hangokat tud a helyszínen generálni. A többi generatív AI-technológiához hasonlóan az OpenAI rendszer is a digitális adatok – jelen esetben a videók és a videók tartalmát leíró feliratok – elemzésével tanul.
Az OpenAI nem volt hajlandó megmondani, hogy a rendszer hány videót tanult meg, és honnan származik, kivéve azt, hogy a képzés nyilvánosan elérhető videókat és a szerzői jogok tulajdonosaitól származó videókat tartalmazott. A cég keveset mond a technológiájának betanításához felhasznált adatokról, valószínűleg azért, mert meg akarja őrizni előnyét a versenytársakkal szemben – és többször is beperelték szerzői joggal védett anyagok felhasználása miatt.
(A New York Times decemberben beperelte az OpenAI-t és partnerét, a Microsoftot, az AI-rendszerekkel kapcsolatos hírtartalmak szerzői jogainak megsértésére hivatkozva.)
Sora olyan rövid leírásokra reagálva készít videókat, mint például „a korallzátonyok pompás papírból készült világa, tele színes halakkal és tengeri élőlényekkel”. Bár a videók lenyűgözőek lehetnek, nem mindig tökéletesek, és furcsa és logikátlan képeket is tartalmazhatnak. Például a rendszer nemrégiben készített egy videót arról, hogy valaki sütit eszik – de a süti soha nem lett kisebb.
A DALL-E, a Midjourney és más állóképgenerátorok olyan gyorsan fejlődtek az elmúlt néhány évben, hogy mára olyan képeket készítenek, amelyek szinte megkülönböztethetetlenek a fényképektől. Ez megnehezítette a téves információk online azonosítását, és sok digitális művész panaszkodik, hogy ez megnehezítette számukra az álláskeresést.
„Mindannyian nevettünk 2022-ben, amikor a Midjourney először megjelent, és azt mondta: „Ó, ez aranyos.” – mondta Reid Southin, a film michigani székhelyű koncepcióművésze. „Most az emberek elveszítik a munkájukat a Midjourney miatt.”
„Odaadó úttörő az utazásokban. Szabadúszó sörtudós. Szenvedélyes elemző. Kemény twitter-fanatikus.”
More Stories
Fekete mítosz: A Wukong 1.0.8.14860 frissítés néhány fontos javítást tartalmaz, és különösen egy főnököt gyengít
A Castlevania Dominus Collection fizikai megjelenése megerősítve, az előrendelések a következő hónapban indulnak
Az iPhone 16 még nem jelent meg, és valójában van miért várni az iPhone 17 megjelenéséig