Az OpenAI bemutatja a DALL-E 3-at, amely lehetővé teszi a művészek számára, hogy kilépjenek a képzésből

Kép forrás: Bryce Durbin/TechCrunch

Az OpenAI a mai napon bemutatta szöveg-képfeldolgozó eszközének, a DALL-E-nek továbbfejlesztett változatát, amely a ChatGPT-t – az OpenAI vírusos chatbotját – használja, hogy enyhítse a felszólítás fájdalmát.

Napjaink kifinomult, mesterséges intelligenciájú képalkotási eszközei többsége felszólításokat – képleírásokat – fogad, és számos stílusban műalkotássá alakítja őket, a fotorealisztikustól a fantáziáig. A megfelelő vektor elkészítése azonban kihívást jelenthet, olyannyira, hogy az „agilis mérnök” igazi szakmává vált.

Az OpenAI új eszköze, a DALL-E 3 a ChatGPT-t használja a követelések kitöltéséhez. A ChatGPT-n keresztül az OpenAI prémium ChatGPT-csomagjaira, a ChatGPT Plusra és a ChatGPT Enterprise-ra előfizetők kérést írhatnak egy képre, és finomíthatják azt a chatbottal folytatott beszélgetések során – az eredményeket közvetlenül a chat-alkalmazáson belül kapják meg.

A ChatGPT egy rövid, legfeljebb néhány szóból álló felszólítást tesz, és leíróbbá teszi, így több irányt ad a DALL-E 3 modellnek.

Nem a ChatGPT integráció az egyetlen újdonság a DALL-E 3-ban. A DALL-E 3 jobb minőségű képeket is hoz létre, amelyek pontosabban tükrözik a felszólításokat, mondja az OpenAI – különösen, ha hosszabb üzenetekkel foglalkozik. Jobban kezeli az olyan tartalmakat, amelyek történelmileg hátráltatták a képgenerálási modelleket, például a szöveget és az emberi kezet.

A képet a DALL-E 3 készítette.

Ezenkívül a DALL-E 3 új mechanizmusokkal rendelkezik az algoritmikus torzítás csökkentésére és a biztonság javítására, legalábbis ezt mondja az OpenAI. Például a DALL-E 3 elutasítja azokat a kéréseket, amelyek élő művészek stílusú portrét vagy közéleti személyiségeket ábrázolnak. A művészek most dönthetnek úgy, hogy nem használják fel alkotásaik egy részét – vagy az egészet – arra, hogy az OpenAI modellek jövő generációit tanítsák szöveggé képpé. (Az OpenAI néhány versenytársával együtt pert indít, amiért állítólag művészek szerzői joggal védett műveit használta fel generatív mesterséges intelligencia-képmodelljei képzésére.)

A DALL-E 3 piacra dobása a generatív mesterséges intelligenciaért folyó verseny felforrósodásával történik, különösen a képszintézis területén. Az olyan versenytársak, mint a Midjourney és a Stability AI továbbra is fejlesztik képgeneráló modelleiket, nyomást gyakorolva az OpenAI-ra, hogy talpon maradjon.

READ Elon Musk azt mondja, hogy egy új OpenAI demó miatt csalódottnak érezte magát

Az OpenAI októberben tervezi a DALL-E 3 bevezetését a prémium ChatGPT felhasználók számára, majd ezt követi a kutatólaboratóriumok és API-ügyfelei. A cég nem közölte, hogy mikor – vagy ha – tervezi egy ingyenes webes eszköz kiadását, ahogy a DALL-E 2 és az eredeti DALL-E modell esetében tette.

Jozsef Voros

„Odaadó úttörő az utazásokban. Szabadúszó sörtudós. Szenvedélyes elemző. Kemény twitter-fanatikus.”

Fekete mítosz: A Wukong 1.0.8.14860 frissítés néhány fontos javítást tartalmaz, és különösen egy főnököt gyengít

A Castlevania Dominus Collection fizikai megjelenése megerősítve, az előrendelések a következő hónapban indulnak

Az iPhone 16 még nem jelent meg, és valójában van miért várni az iPhone 17 megjelenéséig

Játékgépek Áttekintése És Sajátosságaik

A következő Golden Globe-díjátadó házigazdája megesküdött, hogy olyan igazságokat mond, mint Ricky Gervais: Ez a műsorom lemondását okozhatja

Hajléktalansággal néznek szembe az ukrán menekültek a magyar menekültügyi szabályváltozás után

GDP (második becslés), vállalati nyereség (előzetes becslés), 2024 II

Vélemény, hozzászólás? Válasz megszakítása

More Stories