繪圖AI - Stable Diffusion 相關安裝教學與參考資源
https://stablediffusionweb.com/
但Stable Diffusion除了網頁上執行,還可以安裝於個人電腦,更方便我們使用。Stable
Diffusion這類的AI繪圖先不講其技術原理,單純以簡單的使用角度來說,他核心就使以兩種模式來產生圖片,分別是txt2img與img2img,就像這麼名稱的字面意思一樣名:
txt2img:文字轉影像,你輸入文字(一般又稱prompt/提詞/關鍵字)來產生圖。
img2img:影像轉影像,你提供參考圖,AI依據參考圖產生新的圖。
Stable
Diffusion是一種開源的程式,是完全免費的算圖工具之一,由於它是開源程式,因此它集合了眾人之力所以更新速度很快,但也不像真的應用程式,有簡便的安裝方式與方便、美觀的介面。以下提供的安裝方式有點麻煩,但在開源軟體的世界,這算是正常的。
整個安裝過程,可以參考下列這個網站:
這個網站也是集結眾人之力,合作完成的資料,資料完整度非常高,從技術簡介、安裝方式到軟體的使用教學,說明得相當完整,只要依照網站提供的步驟,就能完成安裝,如果有興趣進一步了解的朋友,建議參考這個網站。
在我們開始安裝說明之前,我們先了解一下硬體規格需求
最低要求:
-16gb ram
-Nvidia
Maxwell (GTX 7xx) 或更新的 GPU,至少2gb vram
-Linux 或 Windows 7/8/10+
-20gb 磁盤空間
其中要特別說明的是關於顯卡,AI繪圖對於顯卡的要求非常高,因此還是建議有較好顯卡的電腦再來安裝,建議顯卡的記憶體越大越好,基本上它的運算是使用顯卡的GPU進行的。
另外,除了基本程式所需的空間外,它還需要下載各種不同風格的模組,才能有參考的資料庫可以進行運算,因此需要非常大的硬碟空間,建議最好能騰出80G以上的空間是最好的。
步驟1: 安裝Python
Python3.10.6官方載點:https://www.python.org/downloads/release/python-3106/
Python可以視為是一種程式語言,請你依照你的電腦下載對應的版本。一般我們現在使用的windws系統電腦,就直接選最下面的那個64位元的連結即可。現在已經很少32位元的電腦了。
步驟2: 安裝 Git
檔案連結:https://github.com/git-for-windows/git/releases/download/v2.37.3.windows.1/Git-2.37.3-64-bit.exe
完整網站:https://git-scm.com/download/win
步驟3:複製主程式
這個程式我們通常稱為AUTOMATIC1111,使用的介面是WebUI
在桌面空白處按滑鼠右鍵,會看見選單多了兩項,請選擇 “Git Gui Here”。跳出視窗後,選擇中間的選項” Clone Existing Repository”。
這是要將主程式” Clone克隆”複製到你的電腦。請輸入以下的位址到上方來源的空格:
https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
然後,按下方的瀏覽,選擇你要安裝的路徑,接下來就會把程式安裝到指定位置。
步驟4:下載模組
SD的模組非常多,有許多網友也會自行訓練模組再分享到網站。以下是模組的下載網站,我建議可以先下載
https://huggingface.co/models?pipeline_tag=text-to-image&sort=downloads
我推薦的模組,可以先下載這幾個
https://huggingface.co/stabilityai/stable-diffusion-2
風格多元,資料完整,整體效果非常好。
https://huggingface.co/prompthero/openjourney
模仿Midjourney -v4 style
https://huggingface.co/Linaqruf/anything-v3.0
這是日式動漫畫風,是目前最受歡迎的模組,Anything已經出到V4的版本,但V4比較寫實一點,還是很多人喜歡V3的風格。
模組通常有 .safetensors 和.ckpt兩種格式,會建議下載.safetensors的格式,之後使用時,載入的時間比較短,而且安全性也必較高。
以stable-diffusion-2的安裝為例,進入huggingface網頁後,可以在介紹頁面中看到有三個分頁標籤:Model card、Files and versions、Community。
預設的Model card中看它的功能、使用說明和使用限制等等。
點選Files and versions可以到檔案下載的頁面。點選副檔名.safetensors 和.ckpt兩種格式後面的向下的小箭頭,就可以把檔案下載下來了。
步驟5:安裝模組
將下載好的模組,放到你的安裝路徑下,這就要看你是把安裝路徑放在什麼地方了,以下為路徑位置。
X:\stable-diffusion-webui\models\Stable-diffusion
將下載好的檔案,以剪下貼上的方式,放在這個位置就可以了。
有的模組需要搭配.yaml或vae.pt的檔案,但目前多數的情況下可以不必,所以只要把模組放在指定的資料夾後,就可以運行。
步驟6:中文化
這個動作不是必需的,而中文化的檔案也不是官方推出的,是網友們自行製作的,所以如果之後版本更新,而網友沒有人製作,那也會沒有中文化的檔案。檔案請放在這個位置。
X:\stable-diffusion-webui\localizations
網友分享的中文化檔案連結如下:
https://drive.google.com/file/d/1-cmqR4S8rUrg6D4EeWYhzgZmNs5iSpNd/view
步驟7:調整批次檔內容(系統優化指令)
請對webui-user這個批次檔(.bat),按滑鼠右鍵,選擇編輯,進入編輯模式。
如果你的顯卡不到8G請加這些指令,可以有效提升速度。
在第四行set COMMANDLINE_ARGS =後面加下面的這個指令
--xformers(9系列以前顯卡可能不適用)
4GVram
--medvram
2GVram(會很慢可能更適合使用線上版)
--lowvram
因為我的顯卡是3050TI,是4G的顯卡,因此我是這樣加
set COMMANDLINE_ARGS=--xformers --medvram
步驟8:安裝主程式
請點擊剛剛編輯的那個webui-user.bat批次檔,記得安裝過程不要去動到或關閉軟體開啟的視窗。安裝的時間大概要10分鐘左右,請耐心等候。
安裝完畢以後,系統會自動執行,你會發現安裝的DOS介面中,出現了一行網路位址,代表已經安裝完畢了。此時請不要把DOS介面的視窗關閉,你在使用過程中,這個視窗都不能關閉。
進入網站中,到下方的介紹說明中,有一行"Add V1.4 model, which produces slightly more details and better identity than V1.3."
點擊V1.4 model,就可以下載最新的版本。下載的檔案為GFPGANv1.4.pth。
或是直接使用下面這個連結也可以。
https://github.com/TencentARC/GFPGAN/releases/download/v1.3.0/GFPGANv1.4.pth
請把下載的這個檔案,放到你安裝程式的資料夾中,位置如下:
X:\stable-diffusion-webui\models\GFPGAN
正常來說這樣就可以順利運行,在你的WebUI介面中,也會多一個面部修復的選項,可以一定程度上維持臉部的正常。
另外,還有身體和手的補充套件。
https://huggingface.co/lllyasviel/ControlNet/resolve/main/annotator/ckpts/body_pose_model.pth
https://huggingface.co/lllyasviel/ControlNet/resolve/main/annotator/ckpts/hand_pose_model.pth
請把下載的這兩個檔案,放到你安裝程式的資料夾中,位置如下:
X:\stable-diffusion-webui-master\extensions\sd-webui-controlnet\annotator\openpose
再次說明,這些補充套件都只是能一定程度的修正這些異常,並不是真的能解決這些問題。真的要解決這些問題還要靠其他的方式才行。
步驟10:開始使用WebUI
之後要使用SD繪圖時,都要點擊webui-user.bat,程式運行到出現網路位址時才能使用,使用過程中DOS介面都不能關閉。
當程式運行到那行網址出現後,請開啟你的Google
Chrome瀏覽器,並執行那一串網址,就可以開啟WebUI開始繪圖了。
進入介面後,可以到設定-使用者介面-最下面可以更換語文別,更換繁體中文後需要重新載入介面,程序如下:
以上為基本安裝的步驟,使用方式我們下一篇再來繼續說明。
你好,剛剛留言不見了, 想請教步驟7跟步驟8的bat檔是從哪裡來的? 謝謝 找過資料夾也沒有
回覆刪除