Midjourney 應(yīng)用場景5:頭像

2023-05-08 15:26 更新

在 Stock Photo 一章中,介紹了 img2img 的方法,這個方法除了解決 Stock Photo 的那幾個問題外,還很適合多個場景。

本章會著重介紹用這個方法生成的頭像的 prompt。并且從本章開始會逐步豐富我們的 prompt 結(jié)構(gòu),使其更加完整。

注意事項

在介紹 img2img 的應(yīng)用前,我想強調(diào)一下:

  1. 不要在 Discord Midjourney 公開群上傳自己的照片!這樣你的照片會被公開群里的所有人看見。建議使用 Midjourney Bot。
  2. 另外,非 pro 付費會員,生成的圖片都會被其他會員看見。但你可以在生成完頭像后,刪掉生成的圖片。如果還不知道如何使用 Bot ,及刪除照片,請看基本操作篇。
  3. img2img 的操作我就不過多贅述了。如果你還不太清楚,可以看基本操作篇,以及 Stock Photo 那篇。

3D 卡通頭像

第一個要分享的是卡通頭像。首先跟大家強調(diào)下:

  1. 我基本上把國內(nèi)國外的生成頭像教程都看過,并試過一遍,還跟 Midjourney 社群的人也交流過。我的理解是,以目前 V5 的能力,不管你如何調(diào)整 prompt ,想用 img2img 方法生成一張非常像原圖的圖片,基本靠運氣,即使用了前面介紹的技巧七方法,也只是提高概率。如果你有令頭像非常像的方法,不妨通過 Issue 分享給我,我會署下你的名字,并分享給大家。
  2. 各位在學(xué)習(xí)的過程中,如果發(fā)現(xiàn)生成的圖片不像原圖,也不需要氣餒。這是正常的。
  3. 你可以通過我分享的方法,生成一張有原圖神韻的卡通頭像。注意肯定不會非常像原圖。

在 prompt 里加上原圖鏈接(建議使用證件照,或者背景比較單一的照片,這樣成功率會高一些),然后用我前面提到的框架設(shè)計一個 prompt:

Prompt 解釋
類型是什么? Portraits / Avatar 如果你的原圖是證件照,可以在 prompt 里加入「肖像」一詞,或者「Avatar 頭像」。
主體是什么? smiling cute boy, undercut hairstyle 這里可以是選填,你可以先不加這個描述,只填其余 prompt,然后如果生成的圖片不像你。那你就在這里加點描述下你的頭像的詞,一般就是性別、樣貌、發(fā)型、配飾(比如眼鏡、耳環(huán)等)、表情等。注意,盡量挑特征比較強的部分輸入,特征對了,生成的圖片基本會有幾份像。
背景是什么? white background 我這里保留了證件照的白底,你可以加一些實際場景的背景,比如餐廳之類的。
構(gòu)圖是怎樣的? null 因為我們預(yù)先傳了圖片,圖片是張證件照,所以不填
用什么鏡頭? soft focus 柔焦是指攝影中,使用柔焦鏡頭,使得拍攝的影像既清晰又柔和的效果。一般多在拍攝人像的時候使用,我在 prompt 里加上這個,可以使照片更柔和。你也可以不加。
是什么風(fēng)格? 3d render,Pixar style 因為目標(biāo)是生成 3d 照片,所以這里加了 3d render(3d 渲染),以及我喜歡的皮克斯風(fēng)格
參數(shù) —iw 2 iw 是一個文字和 img 權(quán)重參數(shù)。數(shù)值越大,就越像原圖,關(guān)于這個值的介紹,可以看高級參數(shù)篇。

最后,還有三個技巧:

  1. 如果你生成的照片并不像預(yù)設(shè)的照片,可以在四張圖里,挑一張比較像的,然后點 V(Variation),讓模型繼續(xù)生成,再繼續(xù)挑一張像一點的照片,然后繼續(xù)生成新照片,直到出現(xiàn)一張比較像的。
  2. 第二個,我覺得很神奇,如果前兩個方法你都試過了,你生成的圖片還是跟原圖不像,那就在 prompt 里加上「wear glasses(戴眼鏡)」,真的很神奇,我只要加上戴眼鏡就像非常多,如果你原圖戴眼鏡了,你試試在參數(shù)里加個 —no glasses,你會得到一張更不像你的圖。
  3. 最后,就是多用一個參數(shù),這個方法會在技巧八中展開說下。

本章最后,有我的證件照的案例。

技巧七:多參數(shù)同時使用

在使用 img2img 的方法生成頭像時,我發(fā)現(xiàn)問題是「文字權(quán)重比圖片權(quán)重高」,導(dǎo)致其生成的圖片不像原圖,iw 參數(shù)在 V5 里最多提升圖片權(quán)重到 2,所以我就在想有沒有可能進(jìn)一步降低文字的權(quán)重。

然后我就試了下 s 參數(shù),發(fā)現(xiàn)的確好了很多。

如果生成的圖片還是不像,你可以在 —iw 2 基礎(chǔ)上,再加一個參數(shù) —s 200 ,注意同時用兩個參數(shù)時,中間不要有逗號。我發(fā)現(xiàn)加了 s 參數(shù)之后的確像了很多,我個人猜測是 s 和 iw 連用會進(jìn)步一削弱 text 的權(quán)重。

s 是控制生成圖片的風(fēng)格化程度。簡單理解,這個值越低會更符合 text prompt 的描述,數(shù)值越高藝術(shù)性就會越強,但跟 text prompt 關(guān)聯(lián)性就會比較弱。所以如果你生成的圖還是不像,就加大這個值,比如調(diào)到 500。

我想通過這個案例告訴大家,多個參數(shù)一起使用,有可能會形成合力,進(jìn)一步放大模型的能力。未來有新的參數(shù)能力,不妨也想想有沒有可能一起用?

動漫風(fēng)頭像

與 3D 卡通頭像一樣,主要的修改是在圖片風(fēng)格上:

Prompt 解釋
類型是什么? Portraits / Avatar 繼續(xù)使用相同描述
主體是什么? smiling cute boy, undercut hairstyle 繼續(xù)使用相同描述
背景是什么? white background 繼續(xù)使用相同描述
構(gòu)圖是怎樣的? null 繼續(xù)使用相同描述
用什么鏡頭? null 因為是漫畫風(fēng),就不加柔光鏡頭了
是什么風(fēng)格? anime, Studio Ghibli 目標(biāo)是制作動漫風(fēng)的頭像,所以這里加了 anime(動漫),然后加了吉卜力風(fēng)格
參數(shù) —iw 2 —s 500 注意同時用兩個參數(shù)時,中間不要有逗號。

賽博朋克頭像

這是我最喜歡的風(fēng)格之一,也是只需要改一下風(fēng)格和背景即可:

Prompt 解釋
主體是什么? cyberpunk robot face, holographic VR glasses, holographic cyberpunk clothing 加了臉的修飾,還有戴上 VR 眼鏡,穿上賽博朋克風(fēng)衣服
背景是什么? neon-lit cityscape background 為了讓圖片更像是賽博朋克,就加了個霓虹燈城市背景,讓其看起來更有賽博那味
是什么風(fēng)格? Cyberpunk, by Josan Gonzalez 加了賽博朋克風(fēng)格,以及我非常喜歡的賽博朋克畫家 Josan Gonzalez


技巧八:使用 Seed 參數(shù)對圖進(jìn)行二次修改

注意:這個技巧,我個人覺得未來潛力比較大,但目前 Midjourney 的實現(xiàn)效果還比較一般,效果得不到保證。官方的社區(qū)的幫助文檔也提到這個功能在 V5 非常不穩(wěn)定。詳細(xì)可以看看我整理的 Midjourney 官方 FAQ 一章。

你可能遇到類似這樣的場景:

  1. 你輸入一段 prompt,機(jī)器生成了 4 張圖片
  2. 你看了下4張照片,發(fā)現(xiàn)其中有一張還行,但其余不是很滿意,然后改了下 prompt,機(jī)器又生成了一些
  3. 但這次生成的照片你都不滿意,你就很煩惱為何會這樣
  4. 然后你就像為啥不能在第一次生成圖上做修改呢?

基于某一次生成的結(jié)果進(jìn)行二次 prompt 修改,理論上我認(rèn)為是可以的,以賽博朋克頭像為例,我先用上述 prompt 生成了四張圖片,然后在消息的右上角點擊 emoji 按鈕(下圖1),然后再輸入框里(下圖2)輸入 envelope,然后點擊信封 emoji(下圖3),接著 bot 就會將 seed 號碼發(fā)給你。


然后我修改上面的賽博朋克頭像的 prompt,將其背景改為 China Town,此時需要注意:

  1. 新的 prompt 并不是只改 background,你需要將之前的 prompt 都帶上。
  2. prompt 僅修改 background 的部分。
  3. 最后帶上 seed 參數(shù)。

以下是我的案例:

原 prompt:

{img url}  avatar, cyberpunk robot face, holographic VR glasses,holographic cyberpunk clothing, neon-lit cityscape background, Cyberpunk, by Josan Gonzalez --s 500 --iw 1

新 prompt(seed 碼只是示例,你要填寫自己的 seed):

 {img url}  avatar, cyberpunk robot face, holographic VR glasses,holographic cyberpunk clothing, China Town background, Cyberpunk, by Josan Gonzalez --s 500 --iw 1 --seed 758242567

以下是生成的效果(左圖為原圖,右圖是用了 seed 后生成的圖),可以看到,背景的確換了,但人的外觀也有點變化

效果不是很好,但我覺得值得探索,這樣能提高漸進(jìn)優(yōu)化的成功率:


技巧九:神秘的 blend 功能

這個技巧,說實話,我感覺不能稱其為技巧,但這又是一個 Midjourney 非常重要的 feature,所以在這里著重介紹一下。

這個功能使用起來非常簡單,在 Discord 輸入框里 /blend,然后點擊這個菜單:


之后你的輸入框就會變成這樣:


然后你就可以點擊這兩個框,然后選擇你電腦上的照片,添加完成后,點擊回車:


然后 Midjourney 就會生成這樣牛逼的結(jié)果,左邊是融合鋼鐵俠,右邊是融合巴斯光年:


這個功能我第一次看到時,我是非常震驚的,以為是小時候看游戲王里主角們使用「融合卡」的那種效果??上Р⒉皇牵@個功能非常不穩(wěn)定,僅有在滿足多個未知條件才能達(dá)到上述的效果。

我本來打算用這個方法用于生成頭像,但我發(fā)現(xiàn)只要用自己的照片,融合其他風(fēng)格的照片,效果都不太好,目前實驗下來效果最好的是名人頭像,我的感覺是因為 Midjourney 喂了不少名人的頭像給模型,所以這種融合的效果都很好。

但我覺得它真的很適合做頭像,將自己的頭像跟另一張圖片融合一下,就能生成一張不錯的圖,方便又快捷??上壳斑@個功能感覺還不太好用。

當(dāng)然這個功能還不僅僅止于此,它還有很多使用場景,在后續(xù)會介紹給大家。


以上內(nèi)容是否對您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號
微信公眾號

編程獅公眾號