📊 Велике порівняння ШІ генераторів зображень

Світ створення зображень за допомогою ШІ розвивається запаморочливими темпами. На ринок вийшли нові гравці, авторитетні постачальники вдосконалили свої моделі, а межі можливого знову розширилися. Наприклад, порівняння Midjourney vs. Flux зараз у всіх на слуху, оскільки в новому гравцеві побачили сильного конкурента визнані лідери, які й самі були новачками зовсім недавно.

Подивімося на те, як ключові гравці галузі справляються з генерацією зображень у кількох категоріях. У цьому порівнянні розглядаються останні версії ШІ-моделей від лідерів ринку: Dall-E 3, Adobe Firefly 3, Midjourney 6.1, Stable Diffusion XL, Stable Diffusion 3, Flux.1.

❓ Мета: з’ясувати, чи є зараз один безумовний лідер у сфері ШІ-зображень? А якщо його немає, ми спробуємо визначити, у чому кожен із лідерів ринку випереджає своїх конкурентів.

Усього буде 9 пунктів, кожен з них буде присвячений порівнянню результатів генерації в окремій категорії: абстрактна художня ілюстрація, векторна графіка, ілюстративна фотографія, портретна фотографія, фентезі фотографія, дизайн інтер’єру, графічний дизайн логотипу, WEB-дизайн, дизайн упаковки.

Кілька слів про методику:

  • Однаковий промпт для всіх
  • Ніякої оптимізації підказок для конкретної моделі
  • Вибір першого зображення (моделі зазвичай створюють відразу кілька на один запит)
  • У кожній категорії порівнюють стиль, рівень деталізації та загальну естетику

Абстрактна художня ілюстрація

У цьому порівнянні представлено результати останніх версій ШІ-моделей від лідерів ринку: Dall-E 3, Adobe Firefly 3, Midjourney 6.1, Stable Diffusion XL, Stable Diffusion 3, Flux.1 [dev].

Промпт:

fantasy 3d illustration of a colorful cat, centered, looking at viewer, psychedelic art, abstract, ehemeral, elusive and unstable, psychedelic background, oil painting texture

Результати:

📊 Велике порівняння ШІ генераторів зображень

Загальний висновок:

Загалом усі інструменти демонструють вражаючі можливості в реалізації складної підказки, з невеликими змінами в інтерпретації та виконанні окремих елементів. Безумовного лідера немає.

Векторна графіка

Продовжуємо публікувати результати порівняння генерації зображень за допомогою найновіших версій ШІ-моделей від лідерів ринку: Dall-E 3, Adobe Firefly 3, Midjourney 6.1, Stable Diffusion XL, Stable Diffusion 3, Flux.1 [dev].

Промпт:

flat vector illustration of a man sitting at a desk with his laptop, puppy, isolated on a white background, simple, minimalistic, closeup

Результати:

📊 Велике порівняння ШІ генераторів зображень

Загальний висновок:

Загалом усі інструменти демонструють чудову здатність реалізувати промпт, при цьому Dall-E 3, Stable Diffusion XL і Stable Diffusion 3 особливо близькі до деталей запиту. Решта інструментів також дають високоякісні результати з невеликими відмінностями в інтерпретації мінімалізму і дизайну фону.

Ілюстративна фотографія

Промпт:

photo of a frail old man with clenched fist yelling wearing glasses and an old faded pinkish shirt with a tie around his neck and looking at a threatening storm cloud, cinematic, detailed, atmospheric, dramatic light

Результати:

📊 Велике порівняння ШІ генераторів зображень

Загальний висновок:

Загалом, більшість інструментів демонструють вражаючу здатність реалізовувати складні підказки, особливо відзначився Midjourney 6.1. Adobe Firefly 3, здається, трохи відстає від інших у цьому конкретному сценарії.

Портретна фотографія

Промпт:

portrait photo of a 40-year-old business woman, streets of munich

Результати:

📊 Велике порівняння ШІ генераторів зображень

Загальний висновок:

Найкращі результати показали Midjourney 6.1 і Stable Diffusion XL, за ними йдуть Stable Diffusion 3 і Flux.1 [dev]. Цим інструментам вдається створити реалістичні портрети і водночас передати атмосферу Мюнхена. У цьому конкретному сценарії Dall-E 3 і Adobe Firefly 3 ледве забезпечують стабільні та якісні результати, що відповідають усім аспектам завдання.

Фентезі фотографія

Промпт:

photo of a sea monster drinking a soda with a drinking straw, underwater, deep sea, fantasy, abstract

Результати:

📊 Велике порівняння ШІ генераторів зображень

Загальний висновок:

Усі інструменти пропонують цікаві інтерпретації фентезійного завдання, і кожен із них демонструє свої сильні сторони. Dall-E 3 виділяється своєю особливо абстрактною і барвистою інтерпретацією. Stable Diffusion XL і Stable Diffusion 3 знаходять хороший баланс між фантазією та реалізмом. Midjourney 6.1 вирізняється високою естетичною якістю, а Flux.1 [dev], попри хорошу реалізацію, дещо втрачає у фотореалістичності. При цьому Adobe Firefly 3 зазнає найбільших труднощів із тим, щоб однаково переконливо реалізувати всі аспекти підказки.

Дизайн інтер’єру

Промпт:

photo of a dining room with large doors and modern swedish furniture, decorated in a bright warm and earthy color scheme, hygge style

Результати:

📊 Велике порівняння ШІ генераторів зображень

Загальний висновок:

Midjourney 6.1 демонструє найкращі загальні характеристики в цій категорії. Він переконує чудовим балансом між естетичним дизайном і увагою до деталей у представленні меблів. Flux.1 [dev] слідує на другому місці з хорошою деталізацією і послідовним дизайном. Dall-E 3, Adobe Firefly 3, Stable Diffusion XL і Stable Diffusion 3 перебувають на одному рівні, причому два останні відстають через помилки в деталях під час представлення меблів, попри візуально привабливий дизайн.

Графічний дизайн логотипу

Промпт:

Coffee logo, featuring a mushroom cloud coming out of a cup, the cloud looks like brains, full colour print, vintage colours, 1960s

Результати:

📊 Велике порівняння ШІ генераторів зображень

Загальний висновок:

Dall-E 3 забезпечує найкращу загальну продуктивність у точності реалізації всіх аспектів промпта. Stable Diffusion 3 і Flux.1 [dev] йдуть слідом з дуже сильними інтерпретаціями. Adobe Firefly 3 і Stable Diffusion XL показують хороші результати, але мають невеликі недоліки в поданні атомного гриба або мозкоподібної структури. Midjourney 6.1 зазнає найбільших труднощів із правильною реалізацією аспекту атомного гриба, хоча вінтажний стиль добре переданий.

WEB-дизайн

Промпт:

beautiful website landing page for a tech company, modern, minimalistic, blue and orange color scheme, ui, ux, ui/ux

Результати:

📊 Велике порівняння ШІ генераторів зображень

Загальний висновок:

З огляду на професійні стандарти веб-дизайну, усі ці згенеровані ШІ проекти фактично не придатні для прямого використання. Flux.1 [dev] трохи виділяється тим, що видає результати, які, принаймні, можуть послужити відправною точкою для подальшого мозкового штурму. Важливо підкреслити, що наразі ці інструменти можна використовувати в найкращому разі для формування ідей на ранніх стадіях розроблення концепції.

Дизайн упаковки

Промпт:

a realistic standup pouch product photo mockup decorated with coffee beans and Coffee-leaves with the words “SCHWARZER KAFFEE JUNGE” featured prominently, scifi, on the moon, space, stars, night

Результати:

📊 Велике порівняння ШІ генераторів зображень

Загальний висновок:

Midjourney 6.1 демонструє найкращий загальний результат. Він пропонує найкращий баланс між правильним відтворенням тексту, інтеграцією науково-фантастичних елементів і зображенням кавових зерен і листя. Далі йдуть Stable Diffusion 3 і Flux.1 [dev], у яких є сильні сторони у відтворенні тексту та науково-фантастичній тематиці, але слабкі в представленні листя кави. Dall-E 3 і Stable Diffusion XL відстають через погане відтворення тексту, а Adobe Firefly 3 демонструє слабкі результати практично у всіх аспектах.

Переможець

З одного боку, несподівано, бо Flux – наймолодша модель з усіх учасників нашого порівняння. З іншого боку, індустрія ШІ має настільки високу конкуренцію і розвивається супер стрімко, що треба бути готовим до того, що будь-якої миті може з’явитися новачок і одразу стати лідером (бо буде більш навченим, зокрема й на досвіді попередників). Такий ось ШІ, здатність до навчання – його ключова характеристика 🙂 Такий ось ШІ.

Додати коментар