2025年3月24日 星期一

Wan 2.1 影片生成模型安裝教學

 


Wan 2.1 影片生成模型安裝教學

前言

Wan 2.1 是由阿里巴巴旗下的通義實驗室開發的開源影片生成模型,於 2025 年 1 月推出。該模型在多項基準測試中表現優異,尤其在 VBench 評測中名列前茅,超越了包括 Sora、Luma、Pika 等國內外模型。Wan 2.1 支援文生影片、圖生影片、影片編輯等多項任務,並且是首個能夠生成中英文文本的影片模型,無需外部插件即可生成文字。此外,該模型可在消費級 GPU 上運行,13 億參數版本僅需 8.2 GB 顯存即可生成 480P 影片,約 4 分鐘內在 RTX 4090 上生成 5 秒的 480P 影片。適用於 Windows 和 macOS,透過 ComfyUI 來執行。此教學將引導你如何下載、安裝並設定 Wan 2.1,以便能夠在個人電腦上進行影片生成。

硬體需求

Wan 2.1 最低需求 GPU 為 8GB VRAM,建議使用 RTX 3060 以上 的顯示卡,以確保較順暢的運行效果。如果你的顯示卡 VRAM 低於 8GB,可能需要使用 更低精度(fp8) 的模型版本,來降低對顯示卡的負擔。


安裝步驟

1. 下載 ComfyUI 一鍵安裝包

ComfyUI 是一個視覺化的 AI 影像與影片生成工具,能夠輕鬆管理模型與工作流程,先在官網推出的版本已經變更為類似應用程式的單機版,不再是過去的WebUI形式。

官網下載網址https://www.comfy.org/



GitHub下載網址: ComfyUI GitHub

下載後,解壓縮至電腦內適當的資料夾,可更換到如D磁碟槽,預設位置是在個人文件下的ComfyUI,如果你的主硬碟夠大,可以使用預設,預設位置如下:C:\Users\XXX(個人電腦名稱)\Documents\ComfyUI


2. 下載必要的模型檔案

(1) 下載文字編碼器(Text Encoder)與 VAE

這些是 Wan 2.1 必須的輔助模型,確保文字提示能正確轉換成影片。

  • 文字編碼器 (umt5_xxl_fp8_e4m3fn_scaled.safetensors) → 放入 ComfyUI/models/text_encoders/

下載網址:https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/tree/main/split_files/text_encoders
  • VAE (wan_2.1_vae.safetensors) → 放入 ComfyUI/models/vae/

下載網址:https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/blob/main/split_files/vae/wan_2.1_vae.safetensors




(2) 下載 Wan 2.1 影片生成模型

主模型負責生成影片內容,建議下載 fp16 版本,能夠提供最佳畫質。如果顯示卡記憶體不足,可選擇 fp8 版本降低需求,像我筆電是搭配4060 8G的顯卡,所以我選擇wan2.1_t2v_1.3B_fp16.safetensors版本。下方的下載連結,進入後可以進行模型的挑選。檔案中顯示"t2v"是text to vidoe的縮寫,即是由文字生成影片用的模型。"i2v"則是由圖片生成影片用的模型。如果希望從 靜態圖片 轉換成 影片,就需要下載這個模型,這部份我們下一篇教學再說。

  • 建議下載版本

    • wan_2.1_480p_1.3B_fp16.safetensors

    • 若 VRAM 不足,可改用: wan_2.1_480p_1.3B_fp8_scaled.safetensors

    • 建議使用 fp16 版本,而非 bf16 版本,因為 fp16 能夠產生較佳的畫質。

      模型品質等級(由高至低):fp16 > bf16 > fp8_scaled > fp8_e4m3fn

請將下載的模型檔案放入: ComfyUI/models/diffusion_models/

下載網址:https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/tree/main/split_files/diffusion_models


3. 下載並載入 ComfyUI 工作流程(Workflow)

為了順利使用 Wan 2.1,需要使用已設計好的 ComfyUI 工作流程(JSON 檔案)。

  • 下載預設的工作流程檔(適用於文字轉影片):

    • 下載 wan2.1_t2v_workflow.json,放入 ComfyUI/workflows/

    • 下載網址: Json 格式的工作流 (請在此連結,按滑鼠右鍵,另存新檔到桌面)

  • 開啟 ComfyUI,載入 Workflow

    • 啟動 ComfyUI

    • 點選「Load」按鈕,選擇剛下載的 .json 檔案

這樣就完成基本設定,可以開始進行影片生成。


開始生成影片

1. 啟動 ComfyUI

在 ComfyUI 目錄下,執行:

  • Windows:雙擊 run_nvidia_gpu.bat

  • macOS / Linux:在終端機輸入 python main.py

2. 設定影片生成參數

在 ComfyUI 介面中:

  • 輸入文字提示(Prompt)

  • 選擇影片時長(通常 5 秒)

  • 選擇解析度(預設為 512×512,可調整)

3. 開始生成

點選「Queue Prompt」,ComfyUI 會開始運行模型並生成影片。


常見問題與解決方案

Q1:生成速度太慢?

  • 減少影片時長(降低幀數)

  • 使用 fp8 版本的模型降低顯存需求

  • 降低影片解析度

Q2:ComfyUI 無法載入模型?

  • 確保模型檔案放在正確的資料夾

  • 檢查檔名是否完整,不要有 .part 之類的未完成下載標記

Q3:生成影片時出現錯誤?

  • 確保顯示卡驅動為最新版本

  • 檢查 VRAM 是否不足(開啟 Task Manager 觀察 GPU 使用率)


結語

Wan 2.1 是一款功能強大的開源影片生成模型,透過 ComfyUI 讓使用者能夠直覺地進行影片創作。本教學提供從 安裝到基本操作 的完整指南,讓你可以順利在個人電腦上運行並生成影片。但ComfyUI 的操作,對一般人來說可能略為複雜,我們將於另外一篇教學進行簡單超做說明,同時也會搭配影片教學。

如果有任何問題,歡迎提出與我討論或至 ComfyUI 社群尋求幫助!

2024年9月9日 星期一

RHINO 8 練習題 範例--錄音筆

 本練習是繪製日常生活中常見的錄音筆這類的錄音裝置,本次練習的核心是2D架構的概念、布林運算、圓角指令的應用。

本練習已經將部分細節進行了適度調整,以適合初步外觀提案的練習,適合RHINO LEVEL 1的程度,進行外觀繪製的練習,同時提供了底稿並參考工程圖來進行3D建模示範。 此繪製使用了利用曲線擠出與實體的布林運算交叉、差集等概念,強調建模邏輯與實體相關,如曲線圓角、實體導角指令、布林運算等指令應用,特別介紹了基本的螢幕貼圖製作方式。最後使用RHINO 8 內建的彩現器搭配降噪器操作進行產品外觀彩現模擬。 繪製過程中提示的問題,也是過去教學經驗中,學生較容易碰到的問題,可以當作借鏡。整個過程透過實際產品的繪製,將對產品建模的邏輯有所幫助。


彩現模擬圖




2D工程圖與參考底圖





參考貼圖


教學影片連結
https://youtu.be/tDjTJWEJxoM




RHINO 8 練習題 範例--掌上型電玩

 本練習是繪製日常生活中可見的掌上型電玩,本次練習的核心是繪製曲線、取面部林運算、圓角指令的應用。

本練習已經將部分細節進行了適度調整,以適合初步外觀提案的練習,適合RHINO LEVEL 1的程度,進行外觀繪製的練習,同時提供了底稿並參考工程圖來進行3D建模示範。 此繪製使用了不同曲線繪製方式、曲線擠出與實體的布林運算交叉、差集等概念,強調建模邏輯與實體相關,如曲線圓角、實體導角指令、布林運算等指令應用,特別介紹了基本的螢幕貼圖製作方式。最後使用RHINO 8 內建的彩現器搭配降噪器操作進行產品外觀彩現模擬。 繪製過程中提示的問題,也是過去教學經驗中,學生較容易碰到的問題,可以當作借鏡。整個過程透過實際產品的繪製,將對產品建模的邏輯有所幫助。

外觀彩現圖





三視圖與參考底圖





參考貼圖



影片連結
https://youtu.be/H_4Ntc5adu0



2024年9月5日 星期四

RHINO 8 基礎題範例-置物籃

 RHINO 8 基礎題範例-置物籃

RHINO基礎題範例-置物籃,屬於基礎教學,可強化對於繪製的基礎觀念。 透過繪製生活中常常看見的置物籃,來了解基礎指令的應用。 這個練習是偏重基本指令應用的基礎練習,也特別說明RHINO 8 新增的功能,同時介紹轉工程圖的重點以及尺寸標註的注意事項。 主要應用的指令為陣列、擠出、薄殼、導角與布林運算等指令使用上的技巧。





下方附有教學影片連結:

https://youtu.be/3fDs74Xc92c

2024年9月3日 星期二

RHINO 8 基礎題範例-踩腳凳

 RHINO基礎題範例-踩腳凳,屬於基礎教學,可強化對於繪製的基礎觀念。

透過繪製生活中常常看見的踩腳凳,來了解基礎指令的應用。 這個練習是偏重基本指令應用的基礎練習,也特別說明了轉工程圖的重點以及尺寸標註的注意事項。 主要應用的指令為擠出、薄殼、導角與布林運算等指令使用上的技巧。 下方附有可參考的三視圖:




影片連結
https://youtu.be/j0HPCKtB2qY

RHINO 8 基礎題範例-漱口杯

 RHINO基礎題範例-漱口杯,屬於基礎教學,可強化對於繪製的基礎觀念。

透過繪製生活中常常看見的漱口杯,來了解基礎指令的應用。 這個練習是偏重基本指令應用的基礎練習,也特別說明了轉工程圖的重點以及尺寸標註的注意事項。 主要應用的指令為旋轉成型、擠出、薄殼、導角與布林運算等指令使用上的技巧。 下方附有可參考的三視圖:





教學影片連結
https://youtu.be/nwTakJ10F4g


2024年9月2日 星期一

RHINO 8 練習題 範例--風車椅

RHINO 8 練習題 範例--風車椅 

本練習是繪製日常生活中常見到的塑膠椅,但此塑膠椅是較為特殊的風車造型,本次練習的核心是混接曲線、陣列、圓角指令的應用。

本練習已經將部分細節進行了適度調整,以適合初步外觀提案的練習,適合RHINO LEVEL 1的程度,進行外觀繪製的練習,同時提供了底稿並參考工程圖來進行3D建模示範。 此繪製使用了曲線擠出、環形陣列與實體的布林運算交叉、差集等概念,強調建模邏輯與實體相關,如曲線圓角、實體導角指令、布林運算等指令應用,其中特別說明部分混接曲線的作法。最後使用RHINO 8 內建的彩現器搭配降噪器操作進行產品外觀彩現模擬。 繪製過程中提示的問題,也是過去教學經驗中,學生較容易碰到的問題,可以當作借鏡。整個過程透過實際產品的繪製,將對產品建模的邏輯有所幫助。

光線追蹤彩現後的結果






工程圖與可參考的三視圖








教學影片連結
https://www.youtube.com/watch?v=F1rIrXxkHEE

Wan 2.1 影片生成模型安裝教學