Kép forrás: Bryce Durbin/TechCrunch
Az OpenAI a mai napon bemutatta szöveg-képfeldolgozó eszközének, a DALL-E-nek továbbfejlesztett változatát, amely a ChatGPT-t – az OpenAI vírusos chatbotját – használja, hogy enyhítse a felszólítás fájdalmát.
Napjaink kifinomult, mesterséges intelligenciájú képalkotási eszközei többsége felszólításokat – képleírásokat – fogad, és számos stílusban műalkotássá alakítja őket, a fotorealisztikustól a fantáziáig. A megfelelő vektor elkészítése azonban kihívást jelenthet, olyannyira, hogy az „agilis mérnök” igazi szakmává vált.
Az OpenAI új eszköze, a DALL-E 3 a ChatGPT-t használja a követelések kitöltéséhez. A ChatGPT-n keresztül az OpenAI prémium ChatGPT-csomagjaira, a ChatGPT Plusra és a ChatGPT Enterprise-ra előfizetők kérést írhatnak egy képre, és finomíthatják azt a chatbottal folytatott beszélgetések során – az eredményeket közvetlenül a chat-alkalmazáson belül kapják meg.
A ChatGPT egy rövid, legfeljebb néhány szóból álló felszólítást tesz, és leíróbbá teszi, így több irányt ad a DALL-E 3 modellnek.
Nem a ChatGPT integráció az egyetlen újdonság a DALL-E 3-ban. A DALL-E 3 jobb minőségű képeket is hoz létre, amelyek pontosabban tükrözik a felszólításokat, mondja az OpenAI – különösen, ha hosszabb üzenetekkel foglalkozik. Jobban kezeli az olyan tartalmakat, amelyek történelmileg hátráltatták a képgenerálási modelleket, például a szöveget és az emberi kezet.
Ezenkívül a DALL-E 3 új mechanizmusokkal rendelkezik az algoritmikus torzítás csökkentésére és a biztonság javítására, legalábbis ezt mondja az OpenAI. Például a DALL-E 3 elutasítja azokat a kéréseket, amelyek élő művészek stílusú portrét vagy közéleti személyiségeket ábrázolnak. A művészek most dönthetnek úgy, hogy nem használják fel alkotásaik egy részét – vagy az egészet – arra, hogy az OpenAI modellek jövő generációit tanítsák szöveggé képpé. (Az OpenAI néhány versenytársával együtt pert indít, amiért állítólag művészek szerzői joggal védett műveit használta fel generatív mesterséges intelligencia-képmodelljei képzésére.)
A DALL-E 3 piacra dobása a generatív mesterséges intelligenciaért folyó verseny felforrósodásával történik, különösen a képszintézis területén. Az olyan versenytársak, mint a Midjourney és a Stability AI továbbra is fejlesztik képgeneráló modelleiket, nyomást gyakorolva az OpenAI-ra, hogy talpon maradjon.
Az OpenAI októberben tervezi a DALL-E 3 bevezetését a prémium ChatGPT felhasználók számára, majd ezt követi a kutatólaboratóriumok és API-ügyfelei. A cég nem közölte, hogy mikor – vagy ha – tervezi egy ingyenes webes eszköz kiadását, ahogy a DALL-E 2 és az eredeti DALL-E modell esetében tette.
„Odaadó úttörő az utazásokban. Szabadúszó sörtudós. Szenvedélyes elemző. Kemény twitter-fanatikus.”
More Stories
Fekete mítosz: A Wukong 1.0.8.14860 frissítés néhány fontos javítást tartalmaz, és különösen egy főnököt gyengít
A Castlevania Dominus Collection fizikai megjelenése megerősítve, az előrendelések a következő hónapban indulnak
Az iPhone 16 még nem jelent meg, és valójában van miért várni az iPhone 17 megjelenéséig