Wan 2.1 影片生成模型安裝教學
前言
Wan 2.1 是由阿里巴巴旗下的通義實驗室開發的開源影片生成模型,於 2025 年 1 月推出。 該模型在多項基準測試中表現優異,尤其在 VBench 評測中名列前茅,超越了包括 Sora、Luma、Pika 等國內外模型。 Wan 2.1 支援文生影片、圖生影片、影片編輯等多項任務,並且是首個能夠生成中英文文本的影片模型,無需外部插件即可生成文字。 此外,該模型可在消費級 GPU 上運行,13 億參數版本僅需 8.2 GB 顯存即可生成 480P 影片,約 4 分鐘內在 RTX 4090 上生成 5 秒的 480P 影片。適用於 Windows 和 macOS,透過 ComfyUI 來執行。此教學將引導你如何下載、安裝並設定 Wan 2.1,以便能夠在個人電腦上進行影片生成。
硬體需求
Wan 2.1 最低需求 GPU 為 8GB VRAM,建議使用 RTX 3060 以上 的顯示卡,以確保較順暢的運行效果。如果你的顯示卡 VRAM 低於 8GB,可能需要使用 更低精度(fp8) 的模型版本,來降低對顯示卡的負擔。
安裝步驟
1. 下載 ComfyUI 一鍵安裝包
ComfyUI 是一個視覺化的 AI 影像與影片生成工具,能夠輕鬆管理模型與工作流程,先在官網推出的版本已經變更為類似應用程式的單機版,不再是過去的WebUI形式。
官網下載網址:https://www.comfy.org/
GitHub下載網址: ComfyUI GitHub
下載後,解壓縮至電腦內適當的資料夾,可更換到如D磁碟槽,預設位置是在個人文件下的ComfyUI,如果你的主硬碟夠大,可以使用預設,預設位置如下:C:\Users\XXX(個人電腦名稱)\Documents\ComfyUI
2. 下載必要的模型檔案
(1) 下載文字編碼器(Text Encoder)與 VAE
這些是 Wan 2.1 必須的輔助模型,確保文字提示能正確轉換成影片。
-
文字編碼器 (
umt5_xxl_fp8_e4m3fn_scaled.safetensors
) → 放入ComfyUI/models/text_encoders/
-
VAE (
wan_2.1_vae.safetensors
) → 放入ComfyUI/models/vae/
下載網址:https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/blob/main/split_files/vae/wan_2.1_vae.safetensors
(2) 下載 Wan 2.1 影片生成模型
主模型負責生成影片內容,建議下載 fp16
版本,能夠提供最佳畫質。如果顯示卡記憶體不足,可選擇 fp8
版本降低需求,像我筆電是搭配4060 8G的顯卡,所以我選擇wan2.1_t2v_1.3B_fp16.safetensors版本。下方的下載連結,進入後可以進行模型的挑選。檔案中顯示"t2v"是text to vidoe的縮寫,即是由文字生成影片用的模型。,"i2v"則是由圖片生成影片用的模型。如果希望從 靜態圖片 轉換成 影片,就需要下載這個模型,這部份我們下一篇教學再說。
-
建議下載版本:
-
wan_2.1_480p_1.3B_fp16.safetensors
-
若 VRAM 不足,可改用:
wan_2.1_480p_1.3B_fp8_scaled.safetensors
建議使用 fp16 版本,而非 bf16 版本,因為 fp16 能夠產生較佳的畫質。
模型品質等級(由高至低):fp16 > bf16 > fp8_scaled > fp8_e4m3fn
-
請將下載的模型檔案放入: ComfyUI/models/diffusion_models/
下載網址:
https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/tree/main/split_files/diffusion_models
3. 下載並載入 ComfyUI 工作流程(Workflow)
為了順利使用 Wan 2.1,需要使用已設計好的 ComfyUI 工作流程(JSON 檔案)。
-
下載預設的工作流程檔(適用於文字轉影片):
-
下載
wan2.1_t2v_workflow.json
,放入ComfyUI/workflows/
下載網址: Json 格式的工作流 (請在此連結,按滑鼠右鍵,另存新檔到桌面)
-
-
開啟 ComfyUI,載入 Workflow
-
啟動 ComfyUI
-
點選「Load」按鈕,選擇剛下載的
.json
檔案
-
這樣就完成基本設定,可以開始進行影片生成。
開始生成影片
1. 啟動 ComfyUI
在 ComfyUI 目錄下,執行:
-
Windows:雙擊
run_nvidia_gpu.bat
-
macOS / Linux:在終端機輸入
python main.py
2. 設定影片生成參數
在 ComfyUI 介面中:
-
輸入文字提示(Prompt)
-
選擇影片時長(通常 5 秒)
-
選擇解析度(預設為 512×512,可調整)
3. 開始生成
點選「Queue Prompt」,ComfyUI 會開始運行模型並生成影片。
常見問題與解決方案
Q1:生成速度太慢?
-
減少影片時長(降低幀數)
-
使用
fp8
版本的模型降低顯存需求 -
降低影片解析度
Q2:ComfyUI 無法載入模型?
-
確保模型檔案放在正確的資料夾
-
檢查檔名是否完整,不要有
.part
之類的未完成下載標記
Q3:生成影片時出現錯誤?
-
確保顯示卡驅動為最新版本
-
檢查 VRAM 是否不足(開啟
Task Manager
觀察 GPU 使用率)
結語
Wan 2.1 是一款功能強大的開源影片生成模型,透過 ComfyUI 讓使用者能夠直覺地進行影片創作。本教學提供從 安裝到基本操作 的完整指南,讓你可以順利在個人電腦上運行並生成影片。但ComfyUI 的操作,對一般人來說可能略為複雜,我們將於另外一篇教學進行簡單超做說明,同時也會搭配影片教學。
如果有任何問題,歡迎提出與我討論或至 ComfyUI 社群尋求幫助!