2023年4月4日 星期二

繪圖AI - Stable Diffusion快速以圖生圖產出精緻設計構想,以機車為例



近期很多朋友都在詢問我關於AI應用的問題,其實生成式AI的應用有很多方法,同時也可以用於滿多個地方。生成式AI的應用,我最喜歡的部分是讓AI來協助構想的展開,傳統構想展開的方式,如果要做到視覺化往往會花很多時間在繪圖上面,這部分其實可以讓腦洞亂開的AI來協助,可以在很短的時間內組合出各種不同的想法。

之前文章中,我都用ControlNet來協助,但是隨著Stable Diffusion的更新,我發現我的筆電已經開始跑不動ControlNet了,而且ControlNet雖然精準,但是畢竟是外掛程式,計算時又多了一層,整體計算速度是大幅度增加的,所以我試著改用比較常見的以圖生圖的方式來產出構想,因為這種方式比較不會需要這麼大的顯卡記憶體。

我先用一張不是這麼精緻的機車草圖,然後利用控制變量的方式,找出效果比較好的採樣方式,再測試AI重繪的強度,讓這個變量控制在不會離草圖太遠,又能夠產出新的造型,果然用這種方式又可以高效的產出各種不同的變化型了。整體的操作過程如下 :

步驟一:放入草圖與關鍵字

選定一張草圖,確定比例後,把草圖放在圖生圖的模式下,並設定我們要生成圖的比例,由於我們是想要快速生成一些比較精緻的構想,所以圖的解析度可以不用過高,我是用640x480。





提示詞可以先簡單一點就好,因為我們需要先進行實驗,由於我們是做產品,因此在反向提詞上也不需要加註解解剖學、手指這類的提示詞。

提示詞:concept art, motorbike , stylized, SCI-FI, 3D

負提詞: blender, cropped, lowres, DoF, deep of field, blur, text, error, signature, watermark, username, blurry

步驟二:選擇模組

由於每個模組(models)繪製出來的結果差異很大,而以圖生圖的,最關鍵的重繪幅度更是關鍵。因此我們必須進行一下測試。這個階段我們可以先更換模組(models),搭配重繪幅度0.75,先跑個幾張圖,確定是我們想要的風格。

當然如果你已經有喜歡的模組(models)那這個動作也可以省略。如果出來的圖不夠精緻其實也沒關係,我們之後會在用關鍵字進行調整。

我先選用標準的Stable Diffusion 2來進行實驗。






步驟三:選擇重繪幅度

以圖生圖最關鍵的重繪幅度,因為重繪幅度會直接影響出圖的效果,幅度越小會越接近原稿,重繪幅度越大,則變化越大,但是大過一定程度,幾乎就等於是全新(不相干)的造型了。

因此我們必須進行一下測試,畢竟是構想展開,我們也不希望離原始草圖太遠。如果我們是做把漫畫變成真人的話(或是把真人變成漫畫),我們通常重繪幅度都在0.4以下,但是如果是產品的構想展開的話,建議可以從0.5以上去調整。我就用測試一下0.55、0.6、0.65、0.7、0.75、0.85這6個值。



從上面結果可以看出,0.65時背景出現雲朵,0.85連背景都完全變灰色。藉由這個實驗,我們可以決定我們的重繪幅度,這沒有標準,就看我們希望改變的範圍有多大,我這邊就以0.7這個幅度當標準。

步驟四:決定採樣器

每個模組在不同的採樣器下,所呈現的結果也是不同的,有時候風格差異非常大,基本上選擇什麼採樣器幾乎也是沒有規則可尋,有些模組甚至有不支援的採樣方式。為了能進一步瞭解採樣器對出圖品質的影響,我們還是先測試一下,這次我選用了Euler a, Heun, DPM++ 2S a, LMS Karras, DPM++ SDE Karras, DDIM等六種採樣方式。



可以看到每種採樣方式結果不同,同樣的步數下DPM++已經把背景的天空給表現出來,但是DDIM則保留了原稿的水彩背景。這個選擇同樣是依照個人需求,我們的選擇大概會落在整體表現的精緻度,已經造型的變化度上。畢竟是希望透過AI去進行造型的構想展開,因此還是希望在型態上有所變化,這次我選擇LMS Karras。

步驟五:測試產出造型

基本上這樣就可以去產出造型了,但剛剛有提到『步數』的問題,同樣的步數下每個採樣器的表現不相同,那到底多少部才夠呢?這也是個沒有固定答案的問題,但簡單來說,步數越多AI生成的時間會越久,人臉的生成大概20部就可以表現得很好了,產品則可以多一點,步數越多理論上細節越豐富。這個選擇同樣是依照個人需求,我們這次用50步試試看,其實剛剛的20步我覺得就很不錯了。



我們可以看到,上圖已經形成造型各異的機車了,如果你覺得變化量太大,那我們就再來調整重繪幅度就好,這個就依照個人需求去進行調整,如同模組選擇一樣。

步驟六:關鍵字調整

如果以造型發展為需求,我這樣就差不多了,因為上面六個生成的造型中,我覺得有幾個還不錯,當然如果還不夠的話可以繼續生成,直到滿意為止。甚至機車的配色與背景也可以透過關鍵字來修改。

若是我們希望產出的構想,能夠更為逼真、盡量接近真實的機車,那我們就必須再修改關鍵字以達到這樣的效果,我會使用的關鍵字如下:

提示詞:concept art, motorbike , stylized, max clarity, depth of field, super detailed, hyper photorealistic,  realism, photography, White background


這組關鍵字效果明顯比先前的更逼真一點,就要是敘述中多了關於『攝影』的描述,強調是一張攝影作品。

如果期望在更逼真的效果,可以再進行一些調整,增加攝影的相關參數,例如相機種類、光圈、快門等。我會使用的關鍵字如下:

提示詞:concept art, motorbike , stylized, max clarity, depth of field, super detailed, hyper photorealistic,  realism, photography,  Canon EOS 5D Mark IV DSLR, aperture f/8, shutter speed 1/250 sec, ISO 100, White background

上圖可以看到-整體細節更多,效果也更加逼真,但由於是強調攝影作品,所以白色背景的效果沒有出現,變成了較真實的天空。基本上我們的測試就到這邊完成了,當然你也可以多用更換幾個關鍵字試試,例如增加光源方式或改變車子的配色,下圖就是在更方面條件包含種子均相同的情況下,做幾個關鍵字修改後的成果。


步驟七:補充說明

先前一開始有提到,模組其實是影響AI生圖風格最主要因素,因此我們可以多試試不同的模組,找到我們所需要的效果,例如可以更真實或更科幻等等,這邊我再試另外兩個模組,並挑選幾個不錯的成果,讓大家比較一下不同模組下的差異。










 




沒有留言:

張貼留言

RHINO 8 練習題 範例--錄音筆