Van egy új fotószerkesztő az Apple-től, ha tudja, hol keresse. Az iPhone Kings a Santa Barbarai Kaliforniai Egyetem kutatóival együttműködve olyan eszközt épített ki, amely lehetővé teszi fényképek és képek szöveges utasítások segítségével történő szerkesztését. Nincs hivatalos kiadása, de a kutatók egy bemutatót tartanak, amelyet Ön is kipróbálhat, és amelyet először észleltek Extrém technológia.
A projekt neve Multimodal Large Language Model Guided Image Editing (MGIE). Manapság rengeteg mesterséges intelligencia képszerkesztő szoftver található a piacon. A Photoshop immár beépített mesterséges intelligencia-eszközökkel érkezik, és mások, mint például az OpenAI DALL-E, lehetővé teszik a képek szerkesztését, valamint egész szövetből történő létrehozását. Ha azonban már próbálta használni őket, tudja, hogy ez egy kicsit frusztráló lehet. A mesterséges intelligencia sok esetben nehezen tudja pontosan megérteni, hogy mit keres.
Az MGIE újítása a mesterséges intelligencia értelmezésének egy újabb rétegét egészíti ki. Amikor elmondja az AI-nak, hogy mit szeretne látni, az MGIE először szöveges AI-t használ, hogy az utasításokat világosabbá és leíróbbá tegye. „A kísérleti eredmények azt mutatják, hogy a kifejező utasítások elengedhetetlenek az utasítás alapú képszerkesztéshez” – írták a kutatók egy cikkben. papír Megjelent az arXiv. „Az MGIE jelentős javuláshoz vezethet.”
Az Apple közzétette a szoftver nyílt forráskódú verzióját a következő napon github. Ha ügyes vagy, beszerezhetsz egy példányt az MGIE-ből, ami fut, de a kutatók beállították az eszközt… Arc ölelés. Kicsit lassan fut, ha sokan használják, de szórakoztató élmény.
Az olyan technológiai óriások, mint az Apple, dollármilliárdokat költenek olyan projektekre, amelyeket soha senki nem fog látni, így teljesen lehetséges, hogy az úgynevezett MGIE eszköz soha nem kap hivatalos kiadást. Az Apple nem reagált azonnal a megjegyzéskérésre.
Itt, a Gizmodo irodájában vettük körbe. Feltöltöttem egy fotót a kollégámról és a legközelebbi tanácsadómról, Kyle Barrról fura napszemüvegben, amelyet a Netflixen vettem fel… Szórakoztató elektronikai kiállítás idén. Azt mondtam az Amnesty Internationalnek: „A férfi a sivatagban áll.” A kép létrehozása előtt az MGIE a következőket extrapolálja:
„A férfi fémsisakot visel, és sivatagi környezetben áll. A környező környezet kietlen és kopár, homokdűnék nyúlnak el, ameddig a szem ellát.”
Miután a kelleténél sokkal hosszabb ideig játszottunk az eszközzel, egyértelmű, hogy számos olyan korlátozás vonatkozik rá, mint bármely más mesterséges intelligencia képgenerátorra. Az eredmények gyakran furcsaak, és semmiben sem hasonlítanak a megrendeltekhez. Néhány esetben azonban lenyűgöző munkát végzett, és a szoftver védelmében az AI jobban teljesített az ismert témákkal. Az „ismerős” nem olyasmi, amit Kyle napszemüvegének nevezne.
More Stories
Fekete mítosz: A Wukong 1.0.8.14860 frissítés néhány fontos javítást tartalmaz, és különösen egy főnököt gyengít
A Castlevania Dominus Collection fizikai megjelenése megerősítve, az előrendelések a következő hónapban indulnak
Az iPhone 16 még nem jelent meg, és valójában van miért várni az iPhone 17 megjelenéséig