在 Stock Photo 一章中,介紹了 img2img 的方法,這個方法除了解決 Stock Photo 的那幾個問題外,還很適合多個場景。
本章會著重介紹用這個方法生成的頭像的 prompt。并且從本章開始會逐步豐富我們的 prompt 結(jié)構(gòu),使其更加完整。
在介紹 img2img 的應(yīng)用前,我想強調(diào)一下:
第一個要分享的是卡通頭像。首先跟大家強調(diào)下:
在 prompt 里加上原圖鏈接(建議使用證件照,或者背景比較單一的照片,這樣成功率會高一些),然后用我前面提到的框架設(shè)計一個 prompt:
Prompt | 解釋 | |
---|---|---|
類型是什么? | Portraits / Avatar | 如果你的原圖是證件照,可以在 prompt 里加入「肖像」一詞,或者「Avatar 頭像」。 |
主體是什么? | smiling cute boy, undercut hairstyle | 這里可以是選填,你可以先不加這個描述,只填其余 prompt,然后如果生成的圖片不像你。那你就在這里加點描述下你的頭像的詞,一般就是性別、樣貌、發(fā)型、配飾(比如眼鏡、耳環(huán)等)、表情等。注意,盡量挑特征比較強的部分輸入,特征對了,生成的圖片基本會有幾份像。 |
背景是什么? | white background | 我這里保留了證件照的白底,你可以加一些實際場景的背景,比如餐廳之類的。 |
構(gòu)圖是怎樣的? | null | 因為我們預(yù)先傳了圖片,圖片是張證件照,所以不填 |
用什么鏡頭? | soft focus | 柔焦是指攝影中,使用柔焦鏡頭,使得拍攝的影像既清晰又柔和的效果。一般多在拍攝人像的時候使用,我在 prompt 里加上這個,可以使照片更柔和。你也可以不加。 |
是什么風(fēng)格? | 3d render,Pixar style | 因為目標(biāo)是生成 3d 照片,所以這里加了 3d render(3d 渲染),以及我喜歡的皮克斯風(fēng)格 |
參數(shù) | —iw 2 | iw 是一個文字和 img 權(quán)重參數(shù)。數(shù)值越大,就越像原圖,關(guān)于這個值的介紹,可以看高級參數(shù)篇。 |
最后,還有三個技巧:
本章最后,有我的證件照的案例。
在使用 img2img 的方法生成頭像時,我發(fā)現(xiàn)問題是「文字權(quán)重比圖片權(quán)重高」,導(dǎo)致其生成的圖片不像原圖,iw 參數(shù)在 V5 里最多提升圖片權(quán)重到 2,所以我就在想有沒有可能進(jìn)一步降低文字的權(quán)重。
然后我就試了下 s 參數(shù),發(fā)現(xiàn)的確好了很多。
如果生成的圖片還是不像,你可以在 —iw 2 基礎(chǔ)上,再加一個參數(shù) —s 200 ,注意同時用兩個參數(shù)時,中間不要有逗號。我發(fā)現(xiàn)加了 s 參數(shù)之后的確像了很多,我個人猜測是 s 和 iw 連用會進(jìn)步一削弱 text 的權(quán)重。
s 是控制生成圖片的風(fēng)格化程度。簡單理解,這個值越低會更符合 text prompt 的描述,數(shù)值越高藝術(shù)性就會越強,但跟 text prompt 關(guān)聯(lián)性就會比較弱。所以如果你生成的圖還是不像,就加大這個值,比如調(diào)到 500。
我想通過這個案例告訴大家,多個參數(shù)一起使用,有可能會形成合力,進(jìn)一步放大模型的能力。未來有新的參數(shù)能力,不妨也想想有沒有可能一起用?
與 3D 卡通頭像一樣,主要的修改是在圖片風(fēng)格上:
Prompt | 解釋 | |
---|---|---|
類型是什么? | Portraits / Avatar | 繼續(xù)使用相同描述 |
主體是什么? | smiling cute boy, undercut hairstyle | 繼續(xù)使用相同描述 |
背景是什么? | white background | 繼續(xù)使用相同描述 |
構(gòu)圖是怎樣的? | null | 繼續(xù)使用相同描述 |
用什么鏡頭? | null | 因為是漫畫風(fēng),就不加柔光鏡頭了 |
是什么風(fēng)格? | anime, Studio Ghibli | 目標(biāo)是制作動漫風(fēng)的頭像,所以這里加了 anime(動漫),然后加了吉卜力風(fēng)格 |
參數(shù) | —iw 2 —s 500 | 注意同時用兩個參數(shù)時,中間不要有逗號。 |
這是我最喜歡的風(fēng)格之一,也是只需要改一下風(fēng)格和背景即可:
Prompt | 解釋 | |
---|---|---|
主體是什么? | cyberpunk robot face, holographic VR glasses, holographic cyberpunk clothing | 加了臉的修飾,還有戴上 VR 眼鏡,穿上賽博朋克風(fēng)衣服 |
背景是什么? | neon-lit cityscape background | 為了讓圖片更像是賽博朋克,就加了個霓虹燈城市背景,讓其看起來更有賽博那味 |
是什么風(fēng)格? | Cyberpunk, by Josan Gonzalez | 加了賽博朋克風(fēng)格,以及我非常喜歡的賽博朋克畫家 Josan Gonzalez |
注意:這個技巧,我個人覺得未來潛力比較大,但目前 Midjourney 的實現(xiàn)效果還比較一般,效果得不到保證。官方的社區(qū)的幫助文檔也提到這個功能在 V5 非常不穩(wěn)定。詳細(xì)可以看看我整理的 Midjourney 官方 FAQ 一章。
你可能遇到類似這樣的場景:
基于某一次生成的結(jié)果進(jìn)行二次 prompt 修改,理論上我認(rèn)為是可以的,以賽博朋克頭像為例,我先用上述 prompt 生成了四張圖片,然后在消息的右上角點擊 emoji 按鈕(下圖1),然后再輸入框里(下圖2)輸入 envelope,然后點擊信封 emoji(下圖3),接著 bot 就會將 seed 號碼發(fā)給你。
然后我修改上面的賽博朋克頭像的 prompt,將其背景改為 China Town,此時需要注意:
以下是我的案例:
原 prompt:
{img url} avatar, cyberpunk robot face, holographic VR glasses,holographic cyberpunk clothing, neon-lit cityscape background, Cyberpunk, by Josan Gonzalez --s 500 --iw 1
新 prompt(seed 碼只是示例,你要填寫自己的 seed):
{img url} avatar, cyberpunk robot face, holographic VR glasses,holographic cyberpunk clothing, China Town background, Cyberpunk, by Josan Gonzalez --s 500 --iw 1 --seed 758242567
以下是生成的效果(左圖為原圖,右圖是用了 seed 后生成的圖),可以看到,背景的確換了,但人的外觀也有點變化
效果不是很好,但我覺得值得探索,這樣能提高漸進(jìn)優(yōu)化的成功率:
這個技巧,說實話,我感覺不能稱其為技巧,但這又是一個 Midjourney 非常重要的 feature,所以在這里著重介紹一下。
這個功能使用起來非常簡單,在 Discord 輸入框里 /blend,然后點擊這個菜單:
之后你的輸入框就會變成這樣:
然后你就可以點擊這兩個框,然后選擇你電腦上的照片,添加完成后,點擊回車:
然后 Midjourney 就會生成這樣牛逼的結(jié)果,左邊是融合鋼鐵俠,右邊是融合巴斯光年:
這個功能我第一次看到時,我是非常震驚的,以為是小時候看游戲王里主角們使用「融合卡」的那種效果??上Р⒉皇牵@個功能非常不穩(wěn)定,僅有在滿足多個未知條件才能達(dá)到上述的效果。
我本來打算用這個方法用于生成頭像,但我發(fā)現(xiàn)只要用自己的照片,融合其他風(fēng)格的照片,效果都不太好,目前實驗下來效果最好的是名人頭像,我的感覺是因為 Midjourney 喂了不少名人的頭像給模型,所以這種融合的效果都很好。
但我覺得它真的很適合做頭像,將自己的頭像跟另一張圖片融合一下,就能生成一張不錯的圖,方便又快捷??上壳斑@個功能感覺還不太好用。
當(dāng)然這個功能還不僅僅止于此,它還有很多使用場景,在后續(xù)會介紹給大家。
更多建議: