首頁 > 綜合 > 正文

從0-1,帶你深究MJ中Prompt描述細(xì)節(jié) 環(huán)球觀天下

2023-04-27 09:12:06來源:人人都是產(chǎn)品經(jīng)理  

在Midjourney的使用過程中,除了需要了解如何設(shè)置參數(shù),prompt提示也是使用Midjourney過程中必然涉及的一個(gè)因素。在本篇文章里,作者便結(jié)合案例,對(duì)如何在Midjourney中做好prompt提示進(jìn)行了總結(jié),一起來看。


(相關(guān)資料圖)

前言

在上一篇文章中我們主要了解關(guān)于Midjourney中的絕大部分我們能夠使用到的參數(shù)的內(nèi)容,我相信如果你能夠合理的運(yùn)用了參數(shù),圖片質(zhì)量將提升一大截;那么在這一篇文章中我們來研究關(guān)于MIdjourney中最為和核心的一個(gè)內(nèi)容: prompt ,我將以官方手冊(cè)為基礎(chǔ)帶你更為深入的了解MJ中的這一部分內(nèi)容(大量代練案例,直接融會(huì)貫通)。

在Midjoureny中最基本的提示包括 一個(gè)或多個(gè)圖像URl、多個(gè)文本短語,以及一個(gè)或多個(gè)參數(shù) 組成;本來是想先將最為重要的文本描述講清楚,但想了想還是按照最為合理的順序,依次從圖片描述、文本描述、參數(shù)展開。

一、你需要了解的(圖片提示)基本信息

圖片提示可以作為提示的一部分,他將會(huì)影響 構(gòu)圖,風(fēng)格,和顏色 ;需要注意如果添加圖片提示需要圖片放置文本提示之前,分為圖片+圖片提示和圖片+文本提示,這樣才能工作,單張圖片不行哦~

1. 上傳圖片的兩種形式

點(diǎn)擊“+”號(hào)上傳;拖拽圖片上傳;兩種方式均可,記得上傳之后點(diǎn)回車鍵。

2. 添加圖片URL的兩種形式

第一種形式是最為常見的形式,點(diǎn)擊圖片后在瀏覽器中打開,然后點(diǎn)擊復(fù)制鏈接,但非常推薦第二種形式,上傳圖片后直接鼠標(biāo)點(diǎn)擊圖片不放下拉至Prompt框就好啦!

需要注意的就是需要檢查圖片的URL鏈接結(jié)尾是以: JPG、PNG、GIF ,結(jié)尾。

以及這是上一篇文章中做的一個(gè)圖片權(quán)重參數(shù)值對(duì)于結(jié)果的影響的嘗試,有興趣的可以跳轉(zhuǎn)瀏覽。

二、文本描述

隨著MJ的爆火,逐漸有非常多的網(wǎng)友分享自己的“咒語”,我們只需要cotry+C+V就好,但發(fā)現(xiàn)咒語收藏了很多,但實(shí)際使用的結(jié)果卻差強(qiáng)人意;其實(shí)你可能不知道的是,別人出一張圖背后可能是有上百張的廢稿,文本順序的細(xì)節(jié)變化,墊圖的內(nèi)容,參數(shù)的微小調(diào)整…都會(huì)對(duì)結(jié)果產(chǎn)生不同的影響,所以我們不要關(guān)注咒語本身,嘗試著制造自己的咒語!

文本提示是本文最著重的環(huán)節(jié),同樣也是MJ中最重要的出圖邏輯,文本的描述涉及的內(nèi)容or問題較多,變數(shù)也比較大,例如提示邏輯和文本長度,語法,細(xì)節(jié)描述…等等,讓我們依次來梳理~

1. 你必須了解的(文本提示)基本信息

文本提示是MJ最基礎(chǔ)最重要的一個(gè)功能, MJ bot將提示中的單詞或詞組分解為一個(gè)個(gè)的部分,然后與后臺(tái)訓(xùn)練的數(shù)據(jù)庫進(jìn)行對(duì)比比較,在然后生成圖像 ;在文本提示里,你可以通過很簡(jiǎn)單的單詞甚至一個(gè)emoji就能夠得到超乎意料的結(jié)果(但非常少的提示得到結(jié)果也將非常藝術(shù)化具有很大的隨機(jī)性),當(dāng)然你也可以通過更為細(xì)節(jié)的描述得到符合自己要求的內(nèi)容;下面我們就著重深究。

2. 文本順序?qū)τ诮Y(jié)果的影響

首先,文本的順序到底有什么考究?我們?nèi)绾瓮ㄟ^順序去調(diào)整畫面呢?

在我們?nèi)粘K⒍桃曨l時(shí)能夠常??匆娪袩嵝牡木W(wǎng)友分享關(guān)于寫Prompt的基本邏輯,但內(nèi)容順序和方法各有特色,為了絕對(duì)的可靠咱們還是以官方的建議為標(biāo)準(zhǔn): 主題+媒介+環(huán)境+照明+顏色+情緒+構(gòu)圖。

總的來說: 主體內(nèi)容、背景環(huán)境、構(gòu)圖視角,風(fēng)格和其他要求(顏色,氛圍,構(gòu)圖)描述。

但是,官方的一個(gè)書寫邏輯是一個(gè)范本,我們可以完全遵循他的一個(gè)順序,也可以適當(dāng)?shù)挠兴〉恼{(diào)整;例如:以下是我編輯好的一段關(guān)于以勞動(dòng)者為主題的完整的文本描述(基本是按照官方的一個(gè)推薦順序書寫的)。

實(shí)際得到的結(jié)果是這樣的,畫面確實(shí)不錯(cuò),但是我不想這么寫實(shí),想要卡通一點(diǎn),有點(diǎn)像迪士尼那種3D人物角色的感覺;于是,我把3D、迪士尼、皮克斯風(fēng)格,等相關(guān)的關(guān)鍵詞提前,以此來提高其權(quán)重,如圖,整體得到的結(jié)果已經(jīng)有非常大的改變,為了確定穩(wěn)定性,我接連出了很多張,風(fēng)格基本都能夠固定。

再接著,我覺得畫面的氛圍感不夠,那么如何增加呢?設(shè)想一個(gè)木匠,在工作室中工作,那一定是木屑會(huì)滿天飛,這個(gè)效果對(duì)于氛圍感是一大助力,其實(shí)在前面的文本中也有描述木屑飛揚(yáng),但是由于太居后,權(quán)重比較低,于是乎,將它提前,效果簡(jiǎn)直顯而易見!

(但是這也又慢慢出現(xiàn)一個(gè)新的問題,隨著我將一些詞提前,畫面內(nèi)容逐漸靠后,MJ在年齡的設(shè)定上逐漸模糊,開始出現(xiàn)不同年齡階段的人物,所以對(duì)于把想要的內(nèi)容前置記得適可而止,提高其他1權(quán)重必定會(huì)相應(yīng)降低2權(quán)重)

關(guān)于給關(guān)鍵詞提升權(quán)重,其實(shí)官方也有介紹,在相關(guān)關(guān)鍵詞后面的加上提示(::1 ::2 ::X)也可以提高其權(quán)重,但是之所以本篇文章是通過順序的調(diào)整來提高文本權(quán)重,是因?yàn)楫?dāng)你在使用多提示作為詞與詞之間的區(qū)分時(shí),機(jī)器會(huì)默認(rèn)給你的區(qū)分詞前面加上“1”的權(quán)重(非指定權(quán)重默認(rèn)為1),如果你給一個(gè)詞使用多提示符號(hào),又想給其他詞增加權(quán)重那數(shù)字一定要大于1,否則兩個(gè)詞的權(quán)重將相等(如下圖案例),以及需要額外思考規(guī)避權(quán)重歸一化的問題。我提供的也是我的一個(gè)新的思路點(diǎn),方法千萬條,如果你的需求比較繁雜,不妨兩個(gè)方法一起使用,能達(dá)到最終的結(jié)果都是好方法

官方的一個(gè)例子:

hot:: dog 和 hot::1 dog – hot:: dog::1相等;cup:: cake:: illustration 和 cup::1 cake::1 illustration::1 – cup::1 cake:: illustration:: – cup::2 cake::2 illustration::2 相等

(不過非常推薦在負(fù)權(quán)重中使用“負(fù)提示”比較好用)

三、關(guān)于書寫文本描述的一些小建議

1. 關(guān)于prompt的內(nèi)容長短

MJ的生圖邏輯是通過提示中的單詞或者短語分解成一個(gè)個(gè)小的部分,與數(shù)據(jù)庫中的訓(xùn)練的數(shù)據(jù)進(jìn)行對(duì)比,然后生成圖像;所以在描述時(shí)表達(dá)自自己需要的內(nèi)容即可,對(duì)于不想要的內(nèi)容不必單獨(dú)闡述:“我不想在畫面中看見“花瓶”,畫面中沒有籃球等等”;如果你描述了一個(gè)臥室的場(chǎng)景,bot自由發(fā)揮出了一些你不需要的內(nèi)容,你可以使用負(fù)權(quán)重“– no”來刪除;像這樣有效的描述也在一定程度上能夠精簡(jiǎn)文本的內(nèi)容。

在很多網(wǎng)友的prompt的分享中,我們會(huì)看見很長的一大串的英文提示詞,仔細(xì)查看會(huì)發(fā)現(xiàn)很多相近詞、氛圍詞,或冗長的主體描述,此舉到底對(duì)不對(duì)呢,我們來看看官方的解釋: Mj bot不像人類一樣能夠理解語法、句子結(jié)構(gòu)或單詞; 更少的詞意味著每一個(gè)詞都能有更大的權(quán)重 ,當(dāng)你添加過多繁雜描述,越后的描述詞比重就被逐漸稀釋甚至貨不對(duì)板。

2. 學(xué)會(huì)加限定詞

比如在這一組圖中,雖然整體感覺都還不錯(cuò),但是有一個(gè)缺點(diǎn),里面的人物各不相同,比如在年齡上,穿著上,這個(gè)時(shí)候我們就可以適當(dāng)加上一些補(bǔ)充表述,或者說是限定詞,比如:30歲,西裝。

(但有一點(diǎn)非常重要,很多人喜歡加一些像安慰劑一樣的詞,比如4K 8K,非常高的細(xì)節(jié),超高質(zhì)量內(nèi)容,清晰度等等,這有用嗎?一定程度上是有的,但別過度使用,如果你有背景虛化的描述,又說高清晰度,這不就起沖突么~)

3. 內(nèi)容描述具體

想要的內(nèi)容清楚描述,你當(dāng)然可以含糊其辭,但獲得內(nèi)容的將多樣化隨機(jī)化,無法獲得你想要的具體細(xì)節(jié)。

(比如:你說“一只貓”會(huì)比“貓”更為具體;或你想描述臥室一角,你說這是一個(gè)溫馨的臥室,有花瓶,有床頭柜,有窗簾,這樣當(dāng)然可以,給與bot充分的發(fā)揮空間,沒準(zhǔn)也能夠收獲驚喜;但如果心里沒譜,不妨嘗試這樣描述:這是一個(gè)溫馨的臥室,深棕色的床頭柜上擺放著精致水晶玻璃花瓶,花瓶里面插入著五朵香檳玫瑰,背景是垂落的窗簾~……其實(shí)這也變相的給內(nèi)容增加了一些限制,和上一p一樣~)

4. 使用更為專業(yè)的詞語

MJ并不像CharGPT那么聰明也絕沒有那么笨,當(dāng)你在描述內(nèi)容中,你需要背景虛化的效果,直接說背景需要也是ok的,但是你要是說出: 光圈F2.0 ,尼康 ,那就更為準(zhǔn)確,可以通過關(guān)鍵詞的改變來調(diào)整背景虛化度呢~

四、參數(shù)、參數(shù)、參數(shù)

默認(rèn)參數(shù),在setting設(shè)置中勾選相應(yīng)的內(nèi)容即可將相應(yīng)的參數(shù)調(diào)為默認(rèn)狀態(tài),主要包括:版本(V5),質(zhì)量(q),風(fēng)格化值(s)(圖)橫寬比則需要單獨(dú)描述,所以參數(shù)這個(gè)環(huán)節(jié)在順序上沒有特別的要求,會(huì)默認(rèn)排列,根據(jù)自己的需求設(shè)定合適的參數(shù)范圍即可;還有一個(gè)小細(xì)節(jié)需要注意:當(dāng)你必須添加一個(gè)參數(shù)時(shí),前后之間記得敲上空格,不然會(huì)報(bào)錯(cuò)哦。

(注意每個(gè)參數(shù)在不同的版本之間都有不同的數(shù)值對(duì)比的,詳情可看上一篇文章)

五、需要避開的違禁提示

AIGC產(chǎn)出內(nèi)容要價(jià)值觀!哈哈哈絕對(duì)正能量,在符合discord平臺(tái)的要求的同時(shí)也多多注意中國相關(guān)的AIGC的政策要求。

在使用Prompt中,需要注意提示禁忌;在使用圖片提示時(shí)稍微注意即可,注意圖片的內(nèi)容,不要開車搞顏色;但在在使用文本提示時(shí)需要額外注意,由于大家基本使用的方式都是通過中文描述后使用翻譯復(fù)制黏貼過去,有意無意會(huì)出現(xiàn)我們也不知道的英文違禁詞,例如當(dāng)你使用”蜜桃“時(shí),在英文中俚語和pp相同,所以機(jī)器可能會(huì)以為你在搞顏色,會(huì)警告的哦~

所以咱們要滿滿的正能量,內(nèi)容描述常規(guī)不搞事情(在鏡頭,構(gòu)圖視角上隨便來)。

六、最后

恭喜你閱讀完了全文,最后我做一個(gè)小小的總結(jié),本篇主要講解了關(guān)于Midjourney中最為核心和主要的部分,分別為圖片描述、文本描述、和參數(shù),以及附帶了一點(diǎn)點(diǎn)關(guān)于違禁詞的注意事項(xiàng),比較細(xì)節(jié)的介紹了關(guān)于相關(guān)內(nèi)容的使用方式,希望你瀏覽過本文之后在看見別人的咒語后可以copy下來好好研究一下,無腦復(fù)制一時(shí)爽,自己做時(shí)手忙腳亂(強(qiáng)行不押韻),更多的希望研究背后別人的搭建邏輯, 不做麻瓜,做道長!

如果你也對(duì)AIGC相關(guān)內(nèi)容歡迎關(guān)注與我交流~

本文由 @元旦AIGC 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash ,基于 CC0 協(xié)議

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

標(biāo)簽:

相關(guān)閱讀

精彩推薦

相關(guān)詞

推薦閱讀