Az OpenAI bemutatja a Sorát, egy olyan mesterséges intelligenciát, amely szemet gyönyörködtető videókat készít

Tavaly áprilisban a Runway AI nevű New York-i startup olyan technológiát mutatott be, amely lehetővé teszi az emberek számára, hogy videókat készítsenek, például egy tehénről a születésnapi bulin vagy egy kutyáról, aki okostelefonon beszél, egyszerűen egy mondat beírásával a számítógép képernyőjén.

A négy másodperces videók elmosódottak, szaggatottak, torzak és bosszantóak voltak. De ez egyértelmű jele volt annak, hogy az AI-technológiák egyre lenyűgözőbb videókat fognak generálni az elkövetkező hónapokban és években.

Alig tíz hónappal később a San Francisco-i induló OpenAI bemutatott egy hasonló rendszert, amely olyan videókat készít, amelyek úgy néznek ki, mintha egy hollywoodi filmből vették volna őket. A demonstráció rövid videókat tartalmazott – percek alatt – a havas réten ügető gyapjas mamutokról, az olvadó gyertyát bámuló szörnyetegről, valamint egy olyan jelenetről egy tokiói utcában, amelyet látszólag a városon átsuhanó kamera rögzített.

Az OpenAI, a chatbot ChatGPT és a DALL-E állókép-generátor mögött álló vállalat számos olyan cég közé tartozik, amelyek az ilyen típusú azonnali videógenerátorok fejlesztéséért küzdenek, beleértve az olyan startupokat, mint a Runway, valamint olyan technológiai óriásokat, mint a Google és a Meta, a Facebook és az Instagram tulajdonosa. Ez a technológia felgyorsíthatja a tapasztalt filmesek munkáját, miközben teljesen kiváltja a kevésbé tapasztalt digitális művészeket.

Gyors és olcsó módja is lehet a félretájékoztatás online létrehozásának, ami megnehezíti az online valóság megismerését.

„Teljesen félek attól, hogy ez a fajta dolog hatással lesz egy szűk vitás választásra” – mondta Oren Etzioni, a Washingtoni Egyetem mesterséges intelligenciára szakosodott professzora. Alapítója a True Media non-profit szervezetnek is, amely a politikai kampányokban előforduló online félretájékoztatás azonosítására törekszik.

Az OpenAI az új rendszerét Sorának nevezi, a japán ég szó után. A technológia mögött tevékenykedő csapat, köztük Tim Brooks és Bill Peebles kutatók azért választották ezt a nevet, mert „a korlátlan kreatív potenciál gondolatát idézi”.

READ A Google elismeri, hogy a Wi-Fi-problémák „túl kevés” Pixel 6 telefonnál jelentkeznek, és márciusban kijavítják

Egy interjúban azt is elmondták, hogy a cég még nem hozta nyilvánosságra a Sorát, mert még dolgozik a rendszer kockázatainak megértése érdekében. Ehelyett az OpenAI megosztja a technológiát akadémikusok és más külső kutatók egy kis csoportjával, akik „vörös csapatot” alkotnak, ez a kifejezés arra utal, hogy keresik a visszaélés módját.

„Az a cél, hogy bepillantást engedjünk a láthatáron lévő dolgokba, hogy az emberek lássák ennek a technológiának a képességeit, és visszajelzést kaphassunk” – mondta Dr. Brooks.

Az OpenAI már vízjeleket helyez el a rendszer által készített videókon, amelyek AI által generáltként azonosítják őket, de a vállalat elismeri, hogy eltávolíthatók. Azt is nehéz lehet felismerni. (A New York Times „Generated by AI” vízjeleket adott a történetet tartalmazó videókhoz.)

A rendszer a generatív mesterséges intelligencia példája, amely szöveget, képeket és hangokat tud a helyszínen generálni. A többi generatív AI-technológiához hasonlóan az OpenAI rendszer is a digitális adatok – jelen esetben a videók és a videók tartalmát leíró feliratok – elemzésével tanul.

Az OpenAI nem volt hajlandó megmondani, hogy a rendszer hány videót tanult meg, és honnan származik, kivéve azt, hogy a képzés nyilvánosan elérhető videókat és a szerzői jogok tulajdonosaitól származó videókat tartalmazott. A cég keveset mond a technológiájának betanításához felhasznált adatokról, valószínűleg azért, mert meg akarja őrizni előnyét a versenytársakkal szemben – és többször is beperelték szerzői joggal védett anyagok felhasználása miatt.

(A New York Times decemberben beperelte az OpenAI-t és partnerét, a Microsoftot, az AI-rendszerekkel kapcsolatos hírtartalmak szerzői jogainak megsértésére hivatkozva.)

Sora olyan rövid leírásokra reagálva készít videókat, mint például „a korallzátonyok pompás papírból készült világa, tele színes halakkal és tengeri élőlényekkel”. Bár a videók lenyűgözőek lehetnek, nem mindig tökéletesek, és furcsa és logikátlan képeket is tartalmazhatnak. Például a rendszer nemrégiben készített egy videót arról, hogy valaki sütit eszik – de a süti soha nem lett kisebb.

READ A Takashi Izuka: Sonic Frontiers a Sonic "következő lépése a következő tíz évre".

A DALL-E, a Midjourney és más állóképgenerátorok olyan gyorsan fejlődtek az elmúlt néhány évben, hogy mára olyan képeket készítenek, amelyek szinte megkülönböztethetetlenek a fényképektől. Ez megnehezítette a téves információk online azonosítását, és sok digitális művész panaszkodik, hogy ez megnehezítette számukra az álláskeresést.

„Mindannyian nevettünk 2022-ben, amikor a Midjourney először megjelent, és azt mondta: „Ó, ez aranyos.” – mondta Reid Southin, a film michigani székhelyű koncepcióművésze. „Most az emberek elveszítik a munkájukat a Midjourney miatt.”

Jozsef Voros

„Odaadó úttörő az utazásokban. Szabadúszó sörtudós. Szenvedélyes elemző. Kemény twitter-fanatikus.”

Fekete mítosz: A Wukong 1.0.8.14860 frissítés néhány fontos javítást tartalmaz, és különösen egy főnököt gyengít

A Castlevania Dominus Collection fizikai megjelenése megerősítve, az előrendelések a következő hónapban indulnak

Az iPhone 16 még nem jelent meg, és valójában van miért várni az iPhone 17 megjelenéséig

Játékgépek Áttekintése És Sajátosságaik

A következő Golden Globe-díjátadó házigazdája megesküdött, hogy olyan igazságokat mond, mint Ricky Gervais: Ez a műsorom lemondását okozhatja

Hajléktalansággal néznek szembe az ukrán menekültek a magyar menekültügyi szabályváltozás után

GDP (második becslés), vállalati nyereség (előzetes becslés), 2024 II

Vélemény, hozzászólás? Válasz megszakítása

More Stories