工業設計 & 設計生活---Design & Lifesty: 繪圖AI - Stable Diffusion 相關安裝教學與參考資源

繪圖AI - Stable Diffusion 相關安裝教學與參考資源

Stable Diffusion、Noval AI是近期發展知名的AI繪圖軟體，其中Noval AI更是日本畫師最愛的日式動漫風格AI繪圖，Stable Diffusion、Noval AI的發展都跟時下最熱門的Midjourney一樣，是在網路上執行的，網址如下：

https://novelai.net/

https://stablediffusionweb.com/

但Stable Diffusion除了網頁上執行，還可以安裝於個人電腦，更方便我們使用。Stable Diffusion這類的AI繪圖先不講其技術原理，單純以簡單的使用角度來說，他核心就使以兩種模式來產生圖片，分別是txt2img與img2img，就像這麼名稱的字面意思一樣名：

txt2img：文字轉影像，你輸入文字(一般又稱prompt／提詞／關鍵字)來產生圖。

img2img：影像轉影像，你提供參考圖，AI依據參考圖產生新的圖。

Stable Diffusion是一種開源的程式，是完全免費的算圖工具之一，由於它是開源程式，因此它集合了眾人之力所以更新速度很快，但也不像真的應用程式，有簡便的安裝方式與方便、美觀的介面。以下提供的安裝方式有點麻煩，但在開源軟體的世界，這算是正常的。

整個安裝過程，可以參考下列這個網站：

https://rentry.org/voldy

這個網站也是集結眾人之力，合作完成的資料，資料完整度非常高，從技術簡介、安裝方式到軟體的使用教學，說明得相當完整，只要依照網站提供的步驟，就能完成安裝，如果有興趣進一步了解的朋友，建議參考這個網站。

在我們開始安裝說明之前，我們先了解一下硬體規格需求

最低要求：

-16gb ram

-Nvidia Maxwell (GTX 7xx) 或更新的 GPU，至少2gb vram

-Linux 或 Windows 7/8/10+

-20gb 磁盤空間

其中要特別說明的是關於顯卡，AI繪圖對於顯卡的要求非常高，因此還是建議有較好顯卡的電腦再來安裝，建議顯卡的記憶體越大越好，基本上它的運算是使用顯卡的GPU進行的。

另外，除了基本程式所需的空間外，它還需要下載各種不同風格的模組，才能有參考的資料庫可以進行運算，因此需要非常大的硬碟空間，建議最好能騰出80G以上的空間是最好的。

步驟1：安裝Python

Python3.10.6官方載點：https://www.python.org/downloads/release/python-3106/

Python可以視為是一種程式語言，請你依照你的電腦下載對應的版本。一般我們現在使用的windws系統電腦，就直接選最下面的那個64位元的連結即可。現在已經很少32位元的電腦了。

下載完安裝時這個，下方路徑需要打勾，尤其是最下方的那一個。

步驟2：安裝 Git

檔案連結：https://github.com/git-for-windows/git/releases/download/v2.37.3.windows.1/Git-2.37.3-64-bit.exe

完整網站：https://git-scm.com/download/win

步驟3：複製主程式

這個程式我們通常稱為AUTOMATIC1111，使用的介面是WebUI

在桌面空白處按滑鼠右鍵，會看見選單多了兩項，請選擇 “Git Gui Here”。跳出視窗後，選擇中間的選項” Clone Existing Repository”。

這是要將主程式” Clone克隆”複製到你的電腦。請輸入以下的位址到上方來源的空格：

https://github.com/AUTOMATIC1111/stable-diffusion-webui.git

然後，按下方的瀏覽，選擇你要安裝的路徑，接下來就會把程式安裝到指定位置。

步驟4：下載模組

SD的模組非常多，有許多網友也會自行訓練模組再分享到網站。以下是模組的下載網站，我建議可以先下載

https://huggingface.co/models?pipeline_tag=text-to-image&sort=downloads

風格多元，資料完整，整體效果非常好。

https://huggingface.co/prompthero/openjourney

模仿Midjourney -v4 style

https://huggingface.co/Linaqruf/anything-v3.0

這是日式動漫畫風，是目前最受歡迎的模組，Anything已經出到V4的版本，但V4比較寫實一點，還是很多人喜歡V3的風格。

模組通常有 .safetensors 和.ckpt兩種格式，會建議下載.safetensors的格式，之後使用時，載入的時間比較短，而且安全性也必較高。

以stable-diffusion-2的安裝為例，進入huggingface網頁後，可以在介紹頁面中看到有三個分頁標籤：Model card、Files and versions、Community。

預設的Model card中看它的功能、使用說明和使用限制等等。

點選Files and versions可以到檔案下載的頁面。點選副檔名.safetensors 和.ckpt兩種格式後面的向下的小箭頭，就可以把檔案下載下來了。

步驟5：安裝模組

將下載好的模組，放到你的安裝路徑下，這就要看你是把安裝路徑放在什麼地方了，以下為路徑位置。

X:\stable-diffusion-webui\models\Stable-diffusion

將下載好的檔案，以剪下貼上的方式，放在這個位置就可以了。

有的模組需要搭配.yaml或vae.pt的檔案，但目前多數的情況下可以不必，所以只要把模組放在指定的資料夾後，就可以運行。

步驟6：中文化

這個動作不是必需的，而中文化的檔案也不是官方推出的，是網友們自行製作的，所以如果之後版本更新，而網友沒有人製作，那也會沒有中文化的檔案。檔案請放在這個位置。

X:\stable-diffusion-webui\localizations

網友分享的中文化檔案連結如下：

https://drive.google.com/file/d/1-cmqR4S8rUrg6D4EeWYhzgZmNs5iSpNd/view

步驟7：調整批次檔內容(系統優化指令)

請對webui-user這個批次檔(.bat)，按滑鼠右鍵，選擇編輯，進入編輯模式。

如果你的顯卡不到8G請加這些指令，可以有效提升速度。

在第四行set COMMANDLINE_ARGS =後面加下面的這個指令

--xformers(9系列以前顯卡可能不適用)

4GVram

--medvram

2GVram(會很慢可能更適合使用線上版)

--lowvram

因為我的顯卡是3050TI，是4G的顯卡，因此我是這樣加

set COMMANDLINE_ARGS=--xformers --medvram

步驟8：安裝主程式

請點擊剛剛編輯的那個webui-user.bat批次檔，記得安裝過程不要去動到或關閉軟體開啟的視窗。安裝的時間大概要10分鐘左右，請耐心等候。

安裝完畢以後，系統會自動執行，你會發現安裝的DOS介面中，出現了一行網路位址，代表已經安裝完畢了。此時請不要把DOS介面的視窗關閉，你在使用過程中，這個視窗都不能關閉。

步驟9：安裝一些擴充功能

大家或許有聽說過，AI生成的圖片，常常會有毀容或是手腳變形的情況，這些情況發生的成因各有不同，很難快速的說明。除了在最關鍵的解析度和提詞上來控制外，也有一些可以修正這些狀況的擴充檔案，可以下載來使用。

臉部修正(GFPGAN )

https://github.com/TencentARC/GFPGAN

進入網站中，到下方的介紹說明中，有一行"Add V1.4 model, which produces slightly more details and better identity than V1.3."

點擊V1.4 model，就可以下載最新的版本。下載的檔案為GFPGANv1.4.pth。

或是直接使用下面這個連結也可以。

https://github.com/TencentARC/GFPGAN/releases/download/v1.3.0/GFPGANv1.4.pth

請把下載的這個檔案，放到你安裝程式的資料夾中，位置如下：

X:\stable-diffusion-webui\models\GFPGAN

正常來說這樣就可以順利運行，在你的WebUI介面中，也會多一個面部修復的選項，可以一定程度上維持臉部的正常。

另外，還有身體和手的補充套件。

https://huggingface.co/lllyasviel/ControlNet/resolve/main/annotator/ckpts/body_pose_model.pth

https://huggingface.co/lllyasviel/ControlNet/resolve/main/annotator/ckpts/hand_pose_model.pth

請把下載的這兩個檔案，放到你安裝程式的資料夾中，位置如下：

X:\stable-diffusion-webui-master\extensions\sd-webui-controlnet\annotator\openpose

再次說明，這些補充套件都只是能一定程度的修正這些異常，並不是真的能解決這些問題。真的要解決這些問題還要靠其他的方式才行。

步驟10：開始使用WebUI

之後要使用SD繪圖時，都要點擊webui-user.bat，程式運行到出現網路位址時才能使用，使用過程中DOS介面都不能關閉。

當程式運行到那行網址出現後，請開啟你的Google Chrome瀏覽器，並執行那一串網址，就可以開啟WebUI開始繪圖了。

http://127.0.0.1:7860/

進入介面後，可以到設定-使用者介面-最下面可以更換語文別，更換繁體中文後需要重新載入介面，程序如下：

上方標籤點選Settings(設定)

進入設定頁面後，左側請選擇User interface(使用者介面)這個選項，進入後最下方Localization選項中，選擇zh_TW。

再到頁面最上方，先按Apply Setting套用設定，再按最右邊的Reload UI重新載入介面，就可以更換成中文介面了。由於介面中文化目前並非官方推出，而是熱心的網友自行修正的，因此難免有遺漏，而且版本更新後，中文化未必能夠繼續使用。雖然如此還是非常感謝熱心的網友們提供這麼重要的資源。

以上為基本安裝的步驟，使用方式我們下一篇再來繼續說明。

工業設計 & 設計生活---Design & Lifesty

2023年2月19日星期日

繪圖AI - Stable Diffusion 相關安裝教學與參考資源

1 則留言:

AI生成3D實測--混元3D：從3D生成到3D列印－以假面騎士W為例

搜尋此網誌

2023年2月19日 星期日

繪圖AI - Stable Diffusion 相關安裝教學與參考資源

1 則留言:

AI生成3D實測--混元3D：從3D生成到3D列印－以假面騎士W為例

2023年2月19日星期日