OpenAI, twórca ChatGPT i modeli GPT oraz DALL-E, zaprezentował DALL-E 3, następną wersję generatora obrazów AI, który trafi do płatnych użytkowników ChatGPT w przyszłym miesiącu. Pierwsze efekty wyglądają znacznie bardziej obiecująco od tego, co dziś tworzy Bing Image Creator oparty na DALL-E 2.
DALL·E 3 rozumie znacznie więcej niuansów i szczegółów niż nasze poprzednie systemy, pozwalając ci łatwo tłumaczyć swoje pomysły na wyjątkowo trafne obrazy.
DALL·E 3 jest znacznie lepszy od DALL·E 2 w tworzeniu obrazów, które dokładnie podążają za złożonymi promptami. Przykładowo, DALL·E 3 potrafi dokładnie odzwierciedlić scenę z konkretnymi obiektami i relacjami między nimi. DALL·E 3 zapewnia znaczące ulepszenia w stosunku do DALL·E 2 podczas generowania tekstu na obrazie i szczegółów ludzkich, takich jak dłonie. DALL·E 3 domyślnie tworzy atrakcyjne obrazy — nie są wymagane żadne hacki ani promptowa inżynieria.
— OpenAI
Twórcy dzielą się przykładowymi pracami generatora i trzeba przyznać, że robią duże wrażenie. Oczywiście wybrano takie dzieła, które w wyraźny sposób pokazują postępy względem poprzedniej wersji modelu. Poniżej kilka przykładów, niestety w dość skompresowanej postaci. Obrazy w pełnej krasie i formacie PNG możecie podziwiać na stronie twórców.
An illustration of an avocado sitting in a therapist's chair, saying 'I just feel so empty inside' with a pit-sized hole in its center. The therapist, a spoon, scribbles notes.
Photo of a lychee-inspired spherical chair, with a bumpy white exterior and plush interior, set against a tropical wallpaper.
In front of a deep black backdrop, a figure of middle years, her Tongan skin rich and glowing, is captured mid-twirl, her curly hair flowing like a storm behind her. Her attire resembles a whirlwind of marble and porcelain fragments. Illuminated by the gleam of scattered porcelain shards, creating a dreamlike atmosphere, the dancer manages to appear fragmented, yet maintains a harmonious and fluid form.
A 2D animation of a folk music band composed of anthropomorphic autumn leaves, each playing traditional bluegrass instruments, amidst a rustic forest setting dappled with the soft light of a harvest moon.
Na chwilę obecną daje to (przyszłemu i płatnemu) ChatowiGPT teoretyczną przewagę nad Bing Image Creator, jednak generator obrazów od Microsoftu, zintegrowany z Czatem Bing, SwiftKey, Microsoft 365 Copilot i innymi aplikacjami, najprawdopodobniej również szybko zaadaptuje DALL-E 3 i udostępni go za darmo.
Aktualizacja 21.09.2023: Microsoft poinformował, że część użytkowników Bing Image Creator ma już dostęp do DALL-E 3.
Źródło: https://openai.com/dall-e-3