Midjourney V7 - Nová verze modelu pro AI generování obrazů

💡 Firemní workshopy o umělé inteligenci - pojďme se zamyslet nad tím, jak se vaší firmy dotkne AI a jak se na to připravit!

Patrick Zandl · 5. duben 2025

Midjourney V7 - Nová verze modelu pro AI generování obrazů

Midjourney vydal po zhruba roce od předchozího modelu alfa verzi svého obrazového modelu V7, který přináší změny v kvalitě a funkcionalitě AI generování obrazů. Model zavádí nové funkce měnící způsob interakce s nástrojem a zlepšující kvalitu výstupů.

Klíčové změny modelu V7

Zpracování textových promptů

Model V7 nabízí lepší porozumění textovým promptům. Uživatelé zmiňují schopnost modelu přesněji interpretovat složitější instrukce, což je vítané hlavně pro náročnější práci, kdy jste potřebovali modelu dát lepší zadání. Starší modely prostě delší prompty než cca 100 slov nezpracovávaly dobře.

Zpracování obrazových vstupů

Obrazové prompty dosahují vyšší kvality. V7 lépe zachycuje a reprodukuje textury a detaily z referenčních obrázků.

Kvalita detailů

V7 přináší zlepšení v zobrazování lidských těl, rukou a objektů. Tento aspekt, často kritizovaný u předchozích verzí, byl vylepšen díky lepší koherenci detailů.

Personalizace jako výchozí funkce

Midjourney V7 je první model s aktivovanou personalizací ve výchozím nastavení. Tento přístup vyžaduje počáteční personalizaci (cca 5 minut se tvrdí, ve skutečnosti vyhodnocujete cca 200 obrázků, za mne maličko pruda), následně umožňuje systému interpretovat preference uživatele a vytvářet výstupy odpovídající jeho estetickým preferencím.

Uživatelé se v odezvách shodují v tom, že personalizace přináší lepší výsledky, ačkoliv proces projití personalizace je trochu zdlouhavý.

“Draft Mode”

Významnou inovací je “Draft Mode” (režim nákresů). Dělá to, jak ho pojmenovali - udělá jednodušší verzi obrázku významně rychleji a až jste s ní v pohodě, vygeneruje lepší verzi. Co Draft Mode nabízí:

  • 10x rychlejší renderování obrazů
  • Poloviční náklady oproti standardnímu režimu
  • Konverzační rozhraní pro iteraci nápadů
  • Možnost hlasového ovládání

Podle uživatelů představuje Draft Mode změnu pracovního postupu, umožňující rychlejší experimentování. Draft lze povýšit na plnou kvalitu pomocí funkce “enhance” nebo “vary”.

Dostupné režimy a ceny

V7 začíná ve dvou režimech:

  • Turbo: rychlejší zpracování za dvojnásobnou cenu oproti V6
  • Relax: standardní zpracování za nižší cenu

Standardní režim bude dostupný později. Draft Mode snižuje náklady na polovinu oproti běžnému režimu.

Kompatibilita a plánovaný vývoj

Funkce jako upscaling, editace a retexturing momentálně využívají modely V6. Vývojový tým plánuje aktualizaci těchto funkcí v budoucích verzích. Moodboards a SREF (Self-Reference) jsou funkční a jejich výkon bude postupně vylepšován.

Midjourney plánuje vydávat nové funkce každé 1-2 týdny během následujících 60 dnů. Hlavní připravovanou funkcí je nová V7 reference postav a objektů.

Reakce komunity

Ohlasy z komunity na Redditu zahrnují:

  1. Zlepšení v detailech a texturách
  2. Využití Draft Mode pro kreativní proces
  3. Lepší interpretace textových promptů
  4. Konzistentnější výsledky při generování postav

Někteří uživatelé upozorňují, že V7 vyžaduje jiný přístup k promptování než předchozí verze.

Midjourney V7 představuje další krok v oblasti AI generování obrazů. Kombinace vylepšené kvality, personalizace, Draft Mode a plánovaného vývoje rozšiřuje možnosti nástroje. Pro profesionální uživatele přináší V7 kvalitnější výstupy a efektivnější pracovní postupy.

Model V7 je dostupný v alfa verzi a vývojový tým sbírá zpětnou vazbu od komunity. Je ale dosti zřejmé, že uvolnění proběhlo hodně narychlo, zjevně v reakci na OpenAI 4o obrazový model, který vyšel před několika dny a je skvělý. V každém případě se ukazuje, že Midjourney stále vede v oblasti AI generování obrazů, jenže pro mnoho uživatelů může být kvalita modelu 4o dostatečná. Dám třeba nemám pro kvalitnější obrázky velké uplatnění, takže Midjourney používám jen málo, spíše pro práce zákazníků.

A co ještě při příležitosti uvedení V7 prohlásil CEO David Holze? Společnost pracuje na dříve oznámených modelech pro generování videa a 3D objektů. Těším se!

Dejme si dva příklady, jeden ukazuje kvalitu práce v hi-res oblasti a zejména na fotkách lidí, druhý v případě animovaného stylu. Na internetu již lítají stovky příkladů, pomocí dalších AI nástrojů z toho dělají lidé i spojitá videa :)

Fotorealistický obrázek obličeje

Vygenerované Anime, všímejte si těch detailů

Chcete tyto články emailem?

Twitter, Facebook, Opravit 📃