2023年2月19日 星期日

繪圖AI - Stable Diffusion 相關安裝教學與參考資源

繪圖AI - Stable Diffusion 相關安裝教學與參考資源

 
Stable DiffusionNoval AI是近期發展知名的AI繪圖軟體,其中Noval AI更是日本畫師最愛的日式動漫風格AI繪圖,Stable DiffusionNoval AI的發展都跟時下最熱門的Midjourney一樣,是在網路上執行的,網址如下:

https://novelai.net/

https://stablediffusionweb.com/

Stable Diffusion除了網頁上執行,還可以安裝於個人電腦,更方便我們使用。Stable Diffusion這類的AI繪圖先不講其技術原理,單純以簡單的使用角度來說,他核心就使以兩種模式來產生圖片,分別是txt2imgimg2img,就像這麼名稱的字面意思一樣名:

txt2img:文字轉影像,你輸入文字(一般又稱prompt/提詞/關鍵字)來產生圖。

img2img:影像轉影像,你提供參考圖,AI依據參考圖產生新的圖。

Stable Diffusion是一種開源的程式,是完全免費的算圖工具之一,由於它是開源程式,因此它集合了眾人之力所以更新速度很快,但也不像真的應用程式,有簡便的安裝方式與方便、美觀的介面。以下提供的安裝方式有點麻煩,但在開源軟體的世界,這算是正常的。

整個安裝過程,可以參考下列這個網站:

https://rentry.org/voldy

這個網站也是集結眾人之力,合作完成的資料,資料完整度非常高,從技術簡介、安裝方式到軟體的使用教學,說明得相當完整,只要依照網站提供的步驟,就能完成安裝,如果有興趣進一步了解的朋友,建議參考這個網站。

在我們開始安裝說明之前,我們先了解一下硬體規格需求

最低要求:

-16gb ram

-Nvidia Maxwell (GTX 7xx) 或更新的 GPU,至少2gb vram

-Linux Windows 7/8/10+

-20gb 磁盤空間

其中要特別說明的是關於顯卡,AI繪圖對於顯卡的要求非常高,因此還是建議有較好顯卡的電腦再來安裝,建議顯卡的記憶體越大越好,基本上它的運算是使用顯卡的GPU進行的。

另外,除了基本程式所需的空間外,它還需要下載各種不同風格的模組,才能有參考的資料庫可以進行運算,因此需要非常大的硬碟空間,建議最好能騰出80G以上的空間是最好的。

 

步驟1: 安裝Python

Python3.10.6官方載點:https://www.python.org/downloads/release/python-3106/

Python可以視為是一種程式語言,請你依照你的電腦下載對應的版本。一般我們現在使用的windws系統電腦,就直接選最下面的那個64位元的連結即可。現在已經很少32位元的電腦了。


下載完安裝時這個,下方路徑需要打勾,尤其是最下方的那一個。




步驟2: 安裝 Git

檔案連結:https://github.com/git-for-windows/git/releases/download/v2.37.3.windows.1/Git-2.37.3-64-bit.exe

完整網站:https://git-scm.com/download/win

 

步驟3:複製主程式

這個程式我們通常稱為AUTOMATIC1111,使用的介面是WebUI

在桌面空白處按滑鼠右鍵,會看見選單多了兩項,請選擇 “Git Gui Here”。跳出視窗後,選擇中間的選項 Clone Existing Repository”



這是要將主程式” Clone克隆複製到你的電腦。請輸入以下的位址到上方來源的空格:

https://github.com/AUTOMATIC1111/stable-diffusion-webui.git

然後,按下方的瀏覽,選擇你要安裝的路徑,接下來就會把程式安裝到指定位置。

 





步驟4:下載模組

SD的模組非常多,有許多網友也會自行訓練模組再分享到網站。以下是模組的下載網站,我建議可以先下載

https://huggingface.co/models?pipeline_tag=text-to-image&sort=downloads

我推薦的模組,可以先下載這幾個

https://huggingface.co/stabilityai/stable-diffusion-2

風格多元,資料完整,整體效果非常好。

https://huggingface.co/prompthero/openjourney

模仿Midjourney -v4 style

https://huggingface.co/Linaqruf/anything-v3.0

這是日式動漫畫風,是目前最受歡迎的模組,Anything已經出到V4的版本,但V4比較寫實一點,還是很多人喜歡V3的風格。

模組通常有 .safetensors .ckpt兩種格式,會建議下載.safetensors的格式,之後使用時,載入的時間比較短,而且安全性也必較高。

以stable-diffusion-2的安裝為例,進入huggingface網頁後,可以在介紹頁面中看到有三個分頁標籤:Model card、Files and versions、Community。

預設的Model card中看它的功能、使用說明和使用限制等等。

點選Files and versions可以到檔案下載的頁面。點選副檔名.safetensors .ckpt兩種格式後面的向下的小箭頭,就可以把檔案下載下來了。

 

步驟5:安裝模組

將下載好的模組,放到你的安裝路徑下,這就要看你是把安裝路徑放在什麼地方了,以下為路徑位置。

X:\stable-diffusion-webui\models\Stable-diffusion

將下載好的檔案,以剪下貼上的方式,放在這個位置就可以了。

有的模組需要搭配.yaml或vae.pt的檔案,但目前多數的情況下可以不必,所以只要把模組放在指定的資料夾後,就可以運行。

 

步驟6:中文化

這個動作不是必需的,而中文化的檔案也不是官方推出的,是網友們自行製作的,所以如果之後版本更新,而網友沒有人製作,那也會沒有中文化的檔案。檔案請放在這個位置。

X:\stable-diffusion-webui\localizations

網友分享的中文化檔案連結如下:

https://drive.google.com/file/d/1-cmqR4S8rUrg6D4EeWYhzgZmNs5iSpNd/view

 

步驟7:調整批次檔內容(系統優化指令)

請對webui-user這個批次檔(.bat),按滑鼠右鍵,選擇編輯,進入編輯模式。

如果你的顯卡不到8G請加這些指令,可以有效提升速度。

在第四行set COMMANDLINE_ARGS =後面加下面的這個指令

 --xformers(9系列以前顯卡可能不適用)

4GVram

--medvram

2GVram(會很慢可能更適合使用線上版)

--lowvram

因為我的顯卡是3050TI,是4G的顯卡,因此我是這樣加

set COMMANDLINE_ARGS=--xformers --medvram

 

步驟8:安裝主程式

請點擊剛剛編輯的那個webui-user.bat批次檔,記得安裝過程不要去動到或關閉軟體開啟的視窗。安裝的時間大概要10分鐘左右,請耐心等候。

安裝完畢以後,系統會自動執行,你會發現安裝的DOS介面中,出現了一行網路位址,代表已經安裝完畢了。此時請不要把DOS介面的視窗關閉,你在使用過程中,這個視窗都不能關閉。


步驟9:安裝一些擴充功能

大家或許有聽說過,AI生成的圖片,常常會有毀容或是手腳變形的情況,這些情況發生的成因各有不同,很難快速的說明。除了在最關鍵的解析度和提詞上來控制外,也有一些可以修正這些狀況的擴充檔案,可以下載來使用。

臉部修正(GFPGAN )

https://github.com/TencentARC/GFPGAN 


進入網站中,到下方的介紹說明中,有一行"
Add V1.4 model, which produces slightly more details and better identity than V1.3."

點擊V1.4 model,就可以下載最新的版本。下載的檔案為GFPGANv1.4.pth。

或是直接使用下面這個連結也可以。

https://github.com/TencentARC/GFPGAN/releases/download/v1.3.0/GFPGANv1.4.pth

請把下載的這個檔案,放到你安裝程式的資料夾中,位置如下: 

X:\stable-diffusion-webui\models\GFPGAN

正常來說這樣就可以順利運行,在你的WebUI介面中,也會多一個面部修復的選項,可以一定程度上維持臉部的正常。

另外,還有身體和手的補充套件。

https://huggingface.co/lllyasviel/ControlNet/resolve/main/annotator/ckpts/body_pose_model.pth

https://huggingface.co/lllyasviel/ControlNet/resolve/main/annotator/ckpts/hand_pose_model.pth

請把下載的這兩個檔案,放到你安裝程式的資料夾中,位置如下: 

X:\stable-diffusion-webui-master\extensions\sd-webui-controlnet\annotator\openpose

再次說明,這些補充套件都只是能一定程度的修正這些異常,並不是真的能解決這些問題。真的要解決這些問題還要靠其他的方式才行。


步驟10:開始使用WebUI

之後要使用SD繪圖時,都要點擊webui-user.bat,程式運行到出現網路位址時才能使用,使用過程中DOS介面都不能關閉。

當程式運行到那行網址出現後,請開啟你的Google Chrome瀏覽器,並執行那一串網址,就可以開啟WebUI開始繪圖了。

http://127.0.0.1:7860/

進入介面後,可以到設定-使用者介面-最下面可以更換語文別,更換繁體中文後需要重新載入介面,程序如下:

 上方標籤點選Settings(設定)


進入設定頁面後,左側請選擇User interface(使用者介面)這個選項,進入後最下方Localization選項中,選擇zh_TW。


再到頁面最上方,先按Apply Setting套用設定,再按最右邊的Reload UI重新載入介面,就可以更換成中文介面了。由於介面中文化目前並非官方推出,而是熱心的網友自行修正的,因此難免有遺漏,而且版本更新後,中文化未必能夠繼續使用。雖然如此還是非常感謝熱心的網友們提供這麼重要的資源。


以上為基本安裝的步驟,使用方式我們下一篇再來繼續說明。

1 則留言:

  1. 你好,剛剛留言不見了, 想請教步驟7跟步驟8的bat檔是從哪裡來的? 謝謝 找過資料夾也沒有

    回覆刪除

RHINO 8 基礎題範例-置物籃