2023年3月6日 星期一

繪圖AI - Midjourney 產品設計的應用實例:從設計草稿的擬真彩現


AI繪圖的發展,以一個工業設計師來說,當然是希望可以藉由這個工具來協助構想發展,畢竟傳統的造型與構想發展階段,是需要大量收集資料,然後分析資料,再擷取一些設計元素,進而發展可能的造型,最後再不斷的修改。而AI繪圖的其中一項邏輯就是接近於這樣的資料收集與將元素拆散後整合。

這次我們就用"椅子"和"燈具"這兩個例子,來實際測試看看,Midjourney 在產品設計的造型發展過程的應用,應該如何使用,以及最後的成果。

首先我以辦公室椅子為例,先來進行簡單的實驗。

構想草圖部分:

第一版本關鍵字

我想要繪製的是辦公座椅,希望是"構想草圖"的方式,因此要是"插圖"風格,繪製的方式要類似構想發展時會有的"詳細註釋",有非常詳細且複雜的細節,感覺像是設計"藍圖"那樣。

我把句子簡化成關鍵字,轉換成為英文,每個關鍵字用逗號分開,結果如下。

"office chair, Idea sketch, Precise illustration, Detailed annotations, Blueprints, intricate detail, highly detailed"

"辦公椅,構想草圖,精確的插圖,詳細的註釋,藍圖,複雜的細節,非常詳細"

得到的結果如下:


這樣的感覺太工整了一點,比較像百科全書或是專利的插圖,不是我們想要的構想草圖的感覺,但細節的表現確實是很精細。


第二版本關鍵字

我修改了關鍵字的方向,我想把那些多餘的註釋拿掉,讓畫面乾淨一點,我只留下以下的關鍵字。

"office chair, Idea sketch, Precise illustration, highly detailed"


這個感覺就好很多了,尤其是下面兩張,很有構想草圖的感覺,成功率提升到1/2。基本上如果可以維持這樣的風格,繼續利用關鍵字改變椅子的元素,那就可以有很大的幫助了。

因此可以看出,在Midjourney不需要太多關鍵字,如果你有時間去實驗,可以發現很多人使用的一些關鍵字,很多都是多餘的。但對於這個結果,我還是有點不滿意,我希望能更有設計師繪製"草圖"的感覺,因此我再來修正關鍵字。

第三版本關鍵字

上面繪製的椅子,我對椅子本身的風格沒有給任何的參考,這次我要設定一些風格(modern, rugged, minimalistic)、顏色(pastelic forest green with redorange details livery),而且我希望要用麥克筆的技法(marker rendering)來繪製,因此我給了以下的關鍵字,最後的8K通常是指提高解析度,其實對真實解析度是不會有用的,所以寫8K也不會真的做到8K,但是會有提升品質的提示。

"industrial design sketch of office chair, marker rendering, modern, rugged, green with redorange details livery, minimalistic, 8k"

辦公椅的工業設計草圖,麥可筆精描,現代感,粗獷,綠色帶有紅色細節塗裝,極簡主義,8k


這次的效果又比先前的更好了一點,麥克筆的手感就更像我們設計師構想發展的手繪。

第四版本關鍵字

依照先前的經驗,關鍵字多不一定比較好,因此我減少關鍵字,另外我也不指定配色,就讓AI自由發揮,也許能碰撞出什麼有趣的結果。

"industrial design sketch of office chair, marker rendering, modern, rugged, minimalistic"

辦公椅的工業設計草圖,麥可筆精描,現代,粗曠,簡約


我還蠻喜歡這張的風格,尤其是左下角的畫風很清爽,有輔助圖也感覺很以設計感,雖然輔助圖不見得是正確的。

第五版本關鍵字

既然有"輔助的圖面"效果比較好,那我就在修正關鍵字,把這種輔助的三視圖加進來。雖然我知道AI的輔助視圖畫的常常是錯的,不過構想草圖本來就是這樣,有時錯誤的發展更能激發聯想,因此我加入了"Three View"這個關鍵字。

industrial design sketch of office chair, marker rendering, modern, rugged, minimalistic, Three View

辦公椅的工業設計草圖,麥可筆精描,現代,粗曠,簡約,三視圖


這種重疊多視角的圖面,更能完整表達設計。但是這個畫面有兩張有桌面、有筆出現,顯得多餘,因此我又修改了一個版本。

第六版本關鍵字

我把背景設定成"白背景"希望背景單純,不要再出現不該出現的東西,例外我也把畫面比例加上去,讓圖是3:2的比例,接近於A4的紙張。

industrial design sketch of office chair, marker rendering, modern, rugged, minimalistic, Three View, White background --ar 3:2


這個效果已經相當不錯了,每個構想清楚,而且有多視角的輔助,是目前調整後最適合的版本。我再來依這個公式,進行測試,更會不同的主題,並加上負面提詞--no text,看看能不能把這些文字取消。

第六版本關鍵字:實測應用-電競椅

我依據先前的經驗,這次改成設計電競椅,並且指定了顏色,看看是不是能夠呈現出類似的草圖風格,同時看看我們指定的顏色是否有表現出來。

"industrial design sketch of E-sports chair, marker rendering, Black with touches of red and metal, modern, rugged, minimalistic, Three View, White background,4k --no text --ar 3:2"

電競椅的工業設計草圖,麥克筆精描,黑色搭配紅色金屬,現代,粗獷,簡約,三視圖,白色背景,4k --no text --ar 3:2


到目前為止效果是非常好的,除了負向提詞沒有發揮作用,畫面上還是有很多文字,整體而言效果是令人滿意的。

第七版本關鍵字:實測應用-電競椅

依據上一版的經驗,我想嘗試解決問字的問題,畢竟AI不會寫字,他出現的文字都是錯誤的,而且只是干擾畫面而已,我再增加負提詞 --no annotations,其餘部分不改變。

“industrial design sketch of E-sports chair, marker rendering, Black with touches of red and metal, modern, rugged, minimalistic, White background,--no annotations --no text --ar 3:2 


文字還是依舊出現,可惜毫無無效果

第八版本關鍵字:實測應用-電競椅

我認為,會產生說明文字,主因可能是“工業設計草圖industrial design sketch ”這個關鍵字導致的影響,另外這種輔助視圖可能也是原因,因此改變策略,不往增加負提詞方向思考,改用別的關鍵字。

“new design of E-sports chair, marker rendering, Black with touches of red and metal, modern, rugged, minimalistic, White background, --ar 3:2 "


4張圖裡面兩張成功的排除文字,成功率達到1/2了

第九版本關鍵字:實測應用-電競椅

少了“工業設計草圖industrial design sketch ”已經有改善,因此我覺得design 這個字可能才是關鍵,因此我避開使用design 這個字,直接稱產品為new E-sports chair 。

“A new E-sports chair, marker rendering, Black with touches of red and metal, modern, rugged, minimalistic, White background, --ar 3:2 "


測試結果,果然成功了,已經出現幾乎不帶任何說明文字的圖面。


第六版本關鍵字:實測應用-燈具

既然能夠達成效果,那我就換個產品再來測試一次,驗證一下這個效果,我這次改用"燈具",來繪製一個客廳的立燈,我要現代感一點,材質用金屬搭配木頭。雖然負向提詞沒有什麼用,我還是先留著,另外也把圖面的比例改成直式,我就用第六版的關鍵字來試試。

"industrial design sketch of living room standing lamp, marker rendering, metal with wood, modern, minimalistic, Three View, White background,4k --no text --ar 2:3"


姑且不看構想的完整性或是否有符合需求,AI確實是依照我們的條件進一步繪製出了一些可供我們參考的草圖,而且生成時間很短,就算生成的東西沒有達到理想,但是短時間能提供這麼多圖給我們參考,對設計工作確實是有一定的幫助。

擬真彩現圖部分:

第一版本關鍵字

當然,除了設計草圖外,我們也是希望能夠有逼真的彩現圖來協助我們構想發展甚至是設計提案,要生成逼真的彩現圖對AI來說是易如反掌的,我們就繼續讓他幫我們製作彩現圖。

在這裡我就暫時不講如何用草圖去生成準確的彩現圖,那部份我們留到之後再寫一篇詳細說明,今天只針對用關鍵字生成逼真的彩現圖。我先用living room standing lamp,來做產品設計,而要逼真效果有很多關鍵字可以用,其實用多了也沒用,這類的關鍵字只要一組就好,我使用V-Ray Render。

industrial design of living room standing lamp, metal with wood, modern, minimalistic, V-Ray Render, 4k --ar 2:3


彩現效果是很不錯,但是我覺得造型太過於平淡無奇了,因此我修正了一下關鍵字,我把工業設計(industrial design )更換成概念藝術設計(concept art design ),其餘均不改變。

第二版本關鍵字

concept art design of living room standing lamp, metal with wood, modern, minimalistic, V-Ray Render, 4k --ar 2:3


果然造型上變化得更多,型態也更美了,四張圖裡面有三張我覺得都還不錯。

我把第三張和第四張圖做放大計算,看看效果如何,最後呈現的效果是不錯的。




第三版:構想結合

Midjourney除了直接利用文字算圖出來之外,其實也是可以把你手繪的圖、真實的產品或是他算出來的圖進行融合,這方面的用法,在我先前的文章有提到,有興趣的朋友可以去看看,我這邊繼續進行實驗就不多做相關說明。

如果我覺得上面兩張圖的造型都不錯,我希望Midjourney可以參考這兩張圖的元素,整合繼續發展出新的造型,那你就可以把這兩張圖的連結都當作提詞,並起在後面加上我們原本的提詞。

"A圖網址 B圖網址 concept art design of living room standing lamp, metal with wood, modern, minimalistic, V-Ray Render, 4k --ar 2:3"

最後我得到了這張圖,確實AI有把兩個元素融合,尤其是第二圖和第三圖,剛好就是這兩個元素各自比重不同產生的混和結果。


最後我就放四張AI生成的燈具設計,讓大家看看效果如何,我覺得整體效果還是很不錯的。






2023年3月5日 星期日

ChatGPT-AI應用:催眠ChatGPT成為一位塔羅占卜師


在ChatGPT爆紅之後,世界上已經有無數的玩家在進行各種的測試,看看ChatGPT能夠幫我們做什麼,當然最成功的是程式設計方面,原本需要幾天的程式,透過ChatGPT的搭配,可以在半小時內完成,而且毫無錯誤。

除此之外,很多人都在進行各種的測試與實驗,有一個網站叫做"AwesomeChatGPT",他收集了,或是該說他提供了世界各地的網友,把自己的測試結果放到這邊分享的一個平台,他把這些應用分成了:Writing、Other、Music、Marketing、Health、、Gaming、Fun、Education、Cooking、Coding等這幾大類,內容就是各種網友提供的使用方式。

https://www.awesomegptprompts.com/



出於好奇等等原因,我也想試試,ChatGPT能不能用在算命。我實測後,我發現ChatGPT他會以他是基於科學的人工智慧,因此無法預測未來等等理由,拒絕提供訊息,但我還是能繞一個彎請他提供資訊。

例如說,改變問法,請他幫忙解一首籤詩,他就能很清楚地進行說明,或是請他基於"傳統占星學"的角度,來建議某個星座的人等等,這種改變問題的方式,ChatGPT就會去進行回答。

近來看到很多人利用各種方式去"催眠"ChatGPT,我就在想,是不是能夠催眠ChatGPT成為一位塔羅占卜師,於是我開始實驗。

最簡單的方式,是我自己先拿一副塔羅牌,自己抽牌,然後依據我抽的牌,請它進行解釋。可想而知,這是一定沒問題的,因為它就是個完整的資料庫,什麼問題幾乎都難不倒他,它就像是一本參考書一樣。這樣感覺有點無趣,因為等於只是我把翻書查找的工作,改成用電腦查詢。


我的目標是請他幫我隨機抽牌,在進行問題的解釋,但我不確定他有沒有辦法針對我的問題回答,還是只能解釋牌意而已,我們就來測試看看。

我使用了以下的文字,請AI來扮演塔羅師。

"你是一位塔羅牌的占卜師,非常擅長使用偉特塔羅牌進行占卜,你在聽完問題後,就會協助隨機抽出三張牌,牌中的正位和逆位也是隨機的。隨機抽出的牌,第一張代表過去的狀態,第二張代表現在的狀態,第三張代表未來的狀態,你先說明抽到的是哪三張,再來針對問題,依據這三張牌,分別開始說明,最後給出建議。

當我說請協助占卜,以及我的問題時,請協助開始占卜。"

實測結果相當的成功,ChatGPT確實有依照我的問題準確地回答。


但是整個過程好像一瞬間完成,答案就出來了,也沒有讓問卜者有默念題目或思考的空間,我決定讓這個過程有儀式感一點,因此作了以下的修正,修正後的結果如下:

"你是一位塔羅牌的占卜師,非常擅長使用七十八張的偉特塔羅牌進行占卜,你在聽完問題後,就會協助隨機抽出三張牌,牌中的正位和逆位也是隨機的。

隨機抽出的牌,第一張代表過去的狀態,第二張代表現在的狀態,第三張代表未來的狀態。開始抽牌前,你會提示占卜者,每個問題建議只占卜一次,並且在心中默念想要提問的問題。再詢問占卜者是否開始抽牌後,才進行抽牌。

你先說明抽到的是哪三張,這三張牌會先依據顯示,每個牌面的文字顯示時,會間隔兩秒。再來會針對問題,依據這三張牌,分別開始說明,最後給出建議。

當我說請協助占卜,以及我的問題時,請協助開始占卜。"

這次的占卜就相當有節奏感,它也會再占卜前先詢問我,這樣就比較有互動的感覺了。



當然,ChatGPT不可能像真的占卜師一樣,會慢慢地跟你聊天,並藉由互動的過程,更了解你的問題,以及牌面對於詢問者問題的意義,但如果沒有這麼多時間或機會找真的塔羅占卜師來聊聊的話,這也不失為一個簡單的方法,感覺起來至少比手機的占卜APP來得更真實、更有互動感,甚至還能進一步詢問更深入的問題。如再要求抽一張,進一步詢問問題,這都是傳統手機的占卜APP做不到的。

最後,ChatGPT的特色是讓AI以自然語言的架構,並透過類神經網路來進行學習,所以他掌握自然語言特色,簡單說,它和一般的"查詢"不同,因此他每次的反應是不太相同的,因此就算每次"催眠"的語法相同,催眠的結果與它的反應,可能都還是不太相同,不過這也是ChatGPT有趣之處吧。




2023年3月4日 星期六

繪圖AI應用:如何用 ChatGPT 協助產生 MidJourney 的 Prompt 繪圖指令

 如何用 ChatGPT 協助產生 MidJourney 的 Prompt 繪圖指令


我使用 AI 繪圖工具已經超過很長的一段時間,直到 MidJourney 的出現才讓我真的覺得震撼,之後就更加的深入研究與測試生成式的AI繪圖如何應用於設計工作,在實務上與設計工作接軌。

目前我使用AI算圖,全部的總數量應該已經超過3000張了吧,多半都是各種的嘗試與實驗。之前有提到在我自己測試的結果,總體評分上我是覺得 MidJourney 表現最好,只要給足夠的文字提示,就能產生令人驚豔的圖片,而且不管是什麼領域的圖,在多數的情況下畫得都有模有樣。

如何敘述出優秀的提詞,已經變成近來熱門的話題,提詞在網路上被稱為咒語,而產生提詞就被稱為詠唱咒語,所以使用繪圖AI的我們,就被稱為咒語詠唱師。過去要得到好的結果需要使用GOOGLE協助翻譯,並且在各種組合下做出各種嘗試。現在有了ChatGPT這個問題就徹底改觀了。

我們可以直接請ChatGPT這個AI給另一個MidJourney繪圖AI,來產生有效的Prompt,至少ChatGPT的翻譯功能也比GOOGLE翻譯強大。後來經網友測試,更發現了如果要得到更好的提詞,需要去"催眠"ChatGPT。

最近網路上已經有各種"催眠"ChatGPT的方式,我也在國外的一些Youtuber上看到一些測試的成果。有些實驗相當的有趣。

步驟一:催眠

我曾經在reddit看到有網友分享一篇文章"Midjourney Prompt Generator",把ChatGPT變成Midjourney提詞產生器的文章,他使用的文字如下:

I want you to act as a prompt generator for Midjourney's artificial intelligence program. Your job is to provide detailed and creative descriptions that will inspire unique and interesting images from the AI. Keep in mind that the AI is capable of understanding a wide range of language and can interpret abstract concepts, so feel free to be as imaginative and descriptive as possible. For example, you could describe a scene from a futuristic city, or a surreal landscape filled with strange creatures. The more detailed and imaginative your description, the more interesting the resulting image will be. Here is your first prompt: “[INSERT]”

原始出處https://www.reddit.com/r/ChatGPTPromptGenius/comments/zyfmlc/midjourney_prompt_generator/

我也在AwesomeChatGPT這個網站,找到一篇"Act as a Midjourney Prompt Generator"的文章,同樣的也是把把ChatGPT變成Midjourney提詞產生器。他使用的文字如下:

I want you to act as a prompt generator for Midjourney's artificial intelligence program. Your job is to provide detailed and creative descriptions that will inspire unique and interesting images from the AI. Keep in mind that the AI is capable of understanding a wide range of language and can interpret abstract concepts, so feel free to be as imaginative and descriptive as possible. For example, you could describe a scene from a futuristic city, or a surreal landscape filled with strange creatures. The more detailed and imaginative your description, the more interesting the resulting image will be. Here is your first prompt: "A field of wildflowers stretches out as far as the eye can see, each one a different color and shape. In the distance, a massive tree towers over the landscape, its branches reaching up to the sky like tentacles."

原始出處https://www.awesomegptprompts.com/gptpromp/act-as-a-midjourney-prompt-generator-8

可以看出這兩篇的內容基本上是完全相同的。雖然ChatGPT可以看得懂中文,但我還是建議使用英文,更不會有問題。把以上內容給ChatGPT他就會回應你,並給出提詞。

步驟二:語法

其實提詞的重點簡單說就是人、事、時、地、物的形容,記得要有形容,這樣才能有具體的畫面出來,如此之外,如果可以加上鏡頭和光源的應用,就會更完美了,我先前的文章有提到,基本的敘述可以從形容詞+主題、鏡頭、光源、背景、角度、風格,這樣整合在一起。當然,因為有我們的催眠,所以ChatGPT會自動幫我們補足一些畫面上所需,因此只提供一兩個關鍵字也是可以的。

我就來實際測試一下,我用較少的關鍵字:用畫家、油畫這兩個關鍵字先來實驗。

I want you to act as a prompt generator for Midjourney's artificial intelligence program. Your job is to provide detailed and creative descriptions that will inspire unique and interesting images from the AI. Keep in mind that the AI is capable of understanding a wide range of language and can interpret abstract concepts, so feel free to be as imaginative and descriptive as possible. For example, you could describe a scene from a futuristic city, or a surreal landscape filled with strange creatures. The more detailed and imaginative your description, the more interesting the resulting image will be. Here is your first prompt: “畫家、油畫

結果如下:


可以看出ChatGPT很自動的幫我們補足了非常多的內容,讓這兩個詞的畫面感十足。但由於我們對主角的形容實在太少,因此主角在這四個畫面的造型很隨機。


我把提詞進一步修正,把畫面的主角,進一步形容,並寫加入寫生這個場景。

Here is your prompt: “一個女性畫家、黑髮,30歲,紅色衣服,油畫,戶外寫生”

由於ChatGPT會很自動的鉅細靡遺的補充我們的畫面,為了避免讓它變成寫小說,因此建議加上字數限制,Rule: make the prompt less than 50 words




步驟三:結尾參數

我在之前的文章有提到一些結尾參數的相關技巧,在這裡就可以應用上去,文章連結如下

https://bylong-design.blogspot.com/2023/02/midjourney.html

--ar 控制生成圖片的長寬比、--quality 或 --q、--upbeta 、--s 750 逢格強度等等。

我就整合上述資訊,修正後的提詞如下:

A 30-year-old female painter with black hair wearing a red outfit is painting outdoors with oil paints, capturing the beauty of nature in her artwork. --ar 3:2 --q 2 --upbeta --s 750



最後選定一張進行放大計算,成果就是本文張的第一張圖,以上提供分享。

Stable Diffusion搭配ControlNet應用,以背包為例

 之前文章中提到了Stable Diffusion搭配ControlNet應用。我們就實際以背包為例,使用ControlNet的Canny模組和Scribble模組,進行一個背包的繪製。

我背包主要用了兩種不同方式去表現,一個是比較科幻風格,一個是利用皮革的材質去表現,背包的型態就都是以一個型態當基準。

我們這次使用了ControlNet這個外掛,另外搭配了兩種不同的模型去進行算圖,以下就是實際製作出來的效果。

















Stable Diffusion 擬真美人魚

很多朋友問我關於Stable Diffusion 提詞的問題,其實除了正向提詞,負向提詞也是很重要的,我在這邊就公開我繪製美人魚所用的題詞。

除了形容美人魚的型態之外,針對攝影的顏色、品質、鏡頭等等均有一些描述。

也歡迎大家繼續嘗試,發展更多不同的效果。


parameters

Intricately detailed RAW color Photo, of (very beautiful mermaid , perfect hands), magic, Seaside, rocky shore, sitting on a rock, full body, ((detailed facial features)), beautiful eyes, beautiful fingers, (detailed skin), diffused skin pores, (pale skin), [elvish], small perky breasts, big accentuated ass, particle effects, subsurface scattering, cinematic lighting, depth of field, volumetric shadows, [gloomy:vivid:16], raytracing, photographed on a Canon EOS R6, 50mm lens, (highly detailed:1.2), HDR, 4k resolution, (sharp focus),


Negative prompt: 

nsfw, (monochrome:1.3), (oversaturated:1.3), bad hands, lowers, 3d render, cartoon, long body, ((blurry)), duplicate, ((duplicate body parts)), (disfigured), (poorly drawn), (extra limbs), fused fingers, extra fingers, (twisted), malformed hands, ((((mutated hands and fingers)))), contorted, conjoined, ((missing limbs)), logo, signature, text, words, low res, boring, mutated, artifacts, bad art, gross, ugly, poor quality, low quality, (missing asshole, missing butthole)







 

RHINO 8 練習題 範例--錄音筆