április 27, 2024

Androbit techmagazin

Az Androbit tényeken alapuló híreivel, exkluzív videofelvételeivel, fotóival és frissített térképeivel maradjon naprakész Magyarország legfrissebb fejleményein.

Az OpenAI bemutatja a DALL-E 3-at, amely lehetővé teszi a művészek számára, hogy kilépjenek a képzésből

Az OpenAI bemutatja a DALL-E 3-at, amely lehetővé teszi a művészek számára, hogy kilépjenek a képzésből

Kép forrás: Bryce Durbin/TechCrunch

Az OpenAI a mai napon bemutatta szöveg-képfeldolgozó eszközének, a DALL-E-nek továbbfejlesztett változatát, amely a ChatGPT-t – az OpenAI vírusos chatbotját – használja, hogy enyhítse a felszólítás fájdalmát.

Napjaink kifinomult, mesterséges intelligenciájú képalkotási eszközei többsége felszólításokat – képleírásokat – fogad, és számos stílusban műalkotássá alakítja őket, a fotorealisztikustól a fantáziáig. A megfelelő vektor elkészítése azonban kihívást jelenthet, olyannyira, hogy az „agilis mérnök” igazi szakmává vált.

Az OpenAI új eszköze, a DALL-E 3 a ChatGPT-t használja a követelések kitöltéséhez. A ChatGPT-n keresztül az OpenAI prémium ChatGPT-csomagjaira, a ChatGPT Plusra és a ChatGPT Enterprise-ra előfizetők kérést írhatnak egy képre, és finomíthatják azt a chatbottal folytatott beszélgetések során – az eredményeket közvetlenül a chat-alkalmazáson belül kapják meg.

A ChatGPT egy rövid, legfeljebb néhány szóból álló felszólítást tesz, és leíróbbá teszi, így több irányt ad a DALL-E 3 modellnek.

Nem a ChatGPT integráció az egyetlen újdonság a DALL-E 3-ban. A DALL-E 3 jobb minőségű képeket is hoz létre, amelyek pontosabban tükrözik a felszólításokat, mondja az OpenAI – különösen, ha hosszabb üzenetekkel foglalkozik. Jobban kezeli az olyan tartalmakat, amelyek történelmileg hátráltatták a képgenerálási modelleket, például a szöveget és az emberi kezet.

A képet a DALL-E 3 készítette.

Ezenkívül a DALL-E 3 új mechanizmusokkal rendelkezik az algoritmikus torzítás csökkentésére és a biztonság javítására, legalábbis ezt mondja az OpenAI. Például a DALL-E 3 elutasítja azokat a kéréseket, amelyek élő művészek stílusú portrét vagy közéleti személyiségeket ábrázolnak. A művészek most dönthetnek úgy, hogy nem használják fel alkotásaik egy részét – vagy az egészet – arra, hogy az OpenAI modellek jövő generációit tanítsák szöveggé képpé. (Az OpenAI néhány versenytársával együtt pert indít, amiért állítólag művészek szerzői joggal védett műveit használta fel generatív mesterséges intelligencia-képmodelljei képzésére.)

A DALL-E 3 piacra dobása a generatív mesterséges intelligenciaért folyó verseny felforrósodásával történik, különösen a képszintézis területén. Az olyan versenytársak, mint a Midjourney és a Stability AI továbbra is fejlesztik képgeneráló modelleiket, nyomást gyakorolva az OpenAI-ra, hogy talpon maradjon.

READ  A Humane hordható Ai Pin ára 699 dollár, és 2024 elején kerül kiszállításra

Az OpenAI októberben tervezi a DALL-E 3 bevezetését a prémium ChatGPT felhasználók számára, majd ezt követi a kutatólaboratóriumok és API-ügyfelei. A cég nem közölte, hogy mikor – vagy ha – tervezi egy ingyenes webes eszköz kiadását, ahogy a DALL-E 2 és az eredeti DALL-E modell esetében tette.