社群觀察 · AI 影片工作流

AI 做影片從 0 到 1 條龍:
1.9K 讚 Threads 討論串裡網友的真實工作流

2026 年 5 月 19 日、Threads 用戶 @jworld_49 拋了一個問題:「大家現在用 AI 做影片都怎麼做?」三天內收 1.9K 讚、390 則留言、517 次轉發。 本文是市場觀察、不是實測。把留言區飯店業主、火災安全教學、宣傳營隊、外案製片等 15 位創作者公開分享的工作流彙整、再對每個工具上網查證 2026 年最新公告規格、每位的原留言都附 Threads 連結方便你直接點過去看。

含 5 階段流水線 15 位網友工作流 附原留言連結
⚡ 30 秒看重點

從 Threads 這篇討論串整理出的共同流水線:劇本 → 分鏡 → 角色標準像 → 圖生影片 → 剪輯。15 位網友多數用 Gemini / Claude 寫劇本Midjourney 或即夢生圖Seedance 2.0 / Kling / 即夢做圖生影片CapCut(剪映)剪輯本文是社群觀察整理、作者尚未實測

📖 讀這篇前你需要知道

這篇是純社群觀察 + 資料彙整、給沒做過 AI 影片、想知道大家都在用什麼的人。每個工具規格都是官方 2026 年 5 月公告值、英文名詞會 hover 解釋。作者沒實測過任何一個工作流、本文只負責把網友公開的分享整理乾淨、實際好不好用要自己試了才知道。

The Backstory · 為什麼這串爆紅

一個提問引爆 390 則留言:AI 做影片到底怎麼做?

2026 年 5 月 19 日、Threads 創作者 @jworld_49 發了一則短短 35 字的貼文:「好好奇大家現在用 AI 做影片都怎麼做、從 0 開始一條龍、想說可以集合各方的方法來統整一下。」

三天後、這則貼文累積 1.9K 讚、390 則留言、517 次轉發、2.5K 分享。留言區出現了一個有趣的現象:來分享的人不是 AI 工具廠商、不是影音公司業務、是真的在做影片的人。飯店業主、火災安全教育工作者、外案製片、營隊宣傳設計師、駐泰國的內容創作者⋯⋯每個人都把自己的工作流原汁原味貼出來。

看完留言區、會發現一件事:2026 年做 AI 影片已經沒有「神秘技術」、只有「哪幾個工具串成什麼順序」。本文整理這些留言、再上網查證每個工具的官方規格跟價錢、給你一份直接可以照做的對照表。

📖 什麼叫「從 0 到 1 條龍」?
從一個想法到一支可以發布的影片、整個流程自己一個人用 AI 工具做完、不外包、不請動畫師、不買庫存影片。 比喻:以前做影片要找編劇、分鏡師、攝影、剪接師、配音、配樂、特效。現在這些角色 AI 都能扮、一個人是「導演」、AI 是「全部其他人」。
The Gist · 五階段流水線

15 位網友工作流拆出來,順序幾乎一致

看完留言區的共識

不管做的是飯店廣告、安全教育動畫、還是外案商業影片、流程都長成這樣:劇本 → 分鏡 → 角色標準像 → 圖生影片 → 剪輯。 差別只在每階段選哪個工具

① 劇本Claude / Gemini / ChatGPT
② 分鏡表ChatGPT / Gemini
③ 角色「標準像」Midjourney / 即夢 / Nano Banana Pro
④ 圖生影片Seedance 2.0 / 即夢 / Kling / Runway / Grok Imagine
⑤ 剪輯整合CapCut(剪映)/ Filmora / Adobe AE / DaVinci Resolve

15 位網友各自分享、彙整出來的共同流程。差別只在工具選用、不在順序。

留言裡 @unlimedia_bl 講得很坦白:「花腦袋大約佔總時間 70%、產圖、影片、剪輯加起來才 30%。」@xxmrshanxx 更直接:「首先好的腳本、再來就是砸錢生成生成生成生成。」

意思是:AI 解決的是後段、不是前段。一個人一個晚上做出 1 分鐘宣傳片、靠的是工具夠快、不是想法夠厲害。想法該花的時間還是要花。

Stage Map · 五階段工具地圖

每階段該選哪個工具?網友分享 + 官方查證

每個工具第一次出現都附官方連結、2026 年 5 月最新規格已查證、價格以官方公告為準。

1

劇本:用對話幫你把模糊念頭打磨成結構

出現頻率:留言裡 8 / 11 人提到

劇本這關大家做法很像:先把想講的故事大綱講給 AI 聽、AI 幫你補強情節、調整節奏、加入表情語氣描述@champ_roses.hotel(花蓮飯店業主)形容 Gemini 是「劇本醫生」、把自己寫好的故事丟過去、Gemini 會加更多表情和語氣描述。@moriyama 則是用 Claude 討論劇本框架、人物角色特徵、劇情連結性。

Claude
劇本框架 / 對話深度

強項是結構性思考、適合幫你把「我想拍一個關於 X 的故事」拆成有衝突有轉折的劇本框架。Pro 月費 USD 20

@moriyama 留言 ↗
Gemini
劇本醫生 / 加表情語氣

強項是把寫好的故事修豐潤、補表情、補語氣、補場景描述。免費版 Google 帳號就能用、Pro 月費 NT$650

@champ_roses.hotel ↗@scicharge001 ↗@kenneth881125 ↗
ChatGPT
分鏡大師 / 結構化

強項是把劇本切成分鏡格式、給每個鏡頭時間長度跟畫面描述。Plus 月費 USD 20

@champ_roses.hotel ↗@itskiro_x ↗
📊 留言區的傾向
三個工具都有人推、沒有壓倒性勝出。多位網友提到「腳本花的時間最多」(@unlimedia_bl 估占總時間 70%、@xxmrshanxx 直接說「首先好的腳本」)。差異可能比工具選擇還大。
2

分鏡表:把劇本切成一個個畫面

這階段做得好、後面省一半時間

分鏡(storyboard)就是每個時間節點對應一到兩個畫面。網友共識:分鏡做得好、後續生圖、生影片、剪輯都會順。@moriyama 的工作流寫得最清楚:「分鏡表 → 每個時間節點 1 至 2 個畫面 → 角色標準像 → 各分鏡圖片生成。」

實際做法:把劇本丟給 ChatGPT 或 Gemini、請它把劇本拆成「鏡頭 1 / 5 秒 / 一個小女孩站在花蓮海邊 / 鏡頭從左往右搖」這種格式。多數人這階段花 20 至 40 分鐘。

📖 為什麼分鏡這麼關鍵?
因為 AI 生影片每段只能做 5 至 15 秒。如果你想做 1 分鐘的影片、就要分成 4 到 12 段、每段都有自己的畫面、角色、動作、運鏡。 比喻:分鏡像「樂譜」、生圖跟生影片像「樂手」。沒樂譜、樂手再強也合奏不起來。
3

角色「標準像」+ 分鏡圖:每個鏡頭都要一張定版圖

這階段決定影片好看不好看

角色標準像(character reference)就是每個角色都生一張定版圖、之後所有分鏡都用這張當參考。沒這步、AI 每次生人物臉都長不一樣、影片就會像有五個雙胞胎輪流出鏡。

@itskiro_x(人在泰國的內容創作者)分享一個進階做法:「我用 GPT 生圖、如果圖片細節度需要更準確、例如比較複雜的服裝、文字或場景、我會用 Nano Banana Pro 把解析度升級到 2K 至 4K、再用升級後的圖片來製作影片。」

商業質感 / V7 + Omni Reference

V7 加入「Omni Reference」解決角色一致性問題Basic USD 10、Standard USD 30、Pro USD 60、Mega USD 120。Pro 以上才有 Relax 模式跑不限量。

@moriyama ↗@kenneth881125 ↗
字節跳動 / 中文友善

剪映團隊出的一站式工具、文生圖 + 圖生影片打通、中文 prompt 表現好。Basic 月費 USD 15、Standard USD 35、Advanced USD 70。每天有免費額度可試。

@moriyama ↗@xxmrshanxx ↗@savannachenjiaxi1 ↗
Google Gemini 3 Pro Image

2026 年 2 月推出、強項是原生 4K 解析度、文字渲染準(畫面裡有中英文字標牌的場景特別吃這個)。API USD 0.24 一張 4K 圖、Batch API 對折、Google AI Studio 可試。

@itskiro_x 升解析度心得 ↗@32filmcompany2021 Flow + Nanobanana ↗
直覺、勝在懶人友善

用 ChatGPT 直接打文字就生圖、不用學 prompt 結構。風格偏寫實、商業質感稍輸 Midjourney、但新手最容易上手。Plus 月費 USD 20。

@itskiro_x ↗@champ_roses.hotel ↗@32filmcompany2021 GPT image 2 ↗
4

圖生影片:把靜態圖變 5 到 15 秒動畫

2026 年 AI 影片真正的戰場

圖生影片(image-to-video)是 2026 年競爭最激烈的賽道。每個工具都有自己擅長的場景。網友提到的工具光在這串就有 Seedance 2.0、即夢、Kling、Runway、Grok Imagine 五個。

ByteDance / 2026 年 2 月推出

留言裡出現次數最多的圖生影片工具。最大特色:支援同時餵 12 個參考檔案、能生音視訊同步(影片跟配音同時做)、可生 4 至 15 秒、最高 2K。API USD 0.39–0.86 / 段、Dreamina 訂閱方案 USD 15 / 月起。台灣代理 seedancelumina.com 可申請免費試用。

@itskiro_x ↗@unlimedia_bl ↗@kenneth881125 ↗、台灣代理 @c.oneshot ↗
快手 / 動作控制最強

最大特色:Motion Control、上傳一段參考影片、Kling 把動作抓出來、套用到完全不同的主角。免費 66 credits / 天、Standard USD 6.99 / 月、Pro USD 25.99 / 月、Premier USD 64.99 / 月。年費省約 34%。

@kenneth881125 ↗@viralforge_ai_bot ↗@maaaxtw ↗
老牌 / 4K + 角色一致性

Gen-4 主打角色服裝在多場景間保持一致、Gen-4 Turbo 生 10 秒影片只要 30 秒、是標準版 5 倍速。Free 125 credits / 一次、Standard USD 12–15 / 月、Pro USD 35 起、Unlimited 高階方案

留言區提及度較低、2025 年熱門工具
xAI / X 平台原生

2026 年 2 月升級 Imagine 1.0、影片 10 秒 / 720p / 原生音訊。3 月加「Extend from Frame」、可把前段影片的最後一幀當下一段起點、串成 15 秒以上長片。X Premium 月費 USD 16 起就能用。30 天內全平台生了 12.45 億支影片。

@scicharge001 ↗@viralforge_ai_bot ↗
📊 留言區的工具選擇傾向
Seedance 2.0 出現次數最多(15 位網友中 3 位明確提到)、即夢次之(2 位)、Kling / Runway / Grok各 1 位。但留言樣本小、不代表市占率、僅供參考。每家官方公告的強項:Seedance 訴求音視訊同步、Kling 訴求 Motion Control、Runway 訴求 4K 與多場景角色一致、Grok 訴求 X 平台原生整合、即夢訴求中文 + 一站式。
5

剪輯整合:字幕、配樂、轉場、配音、輸出

AI 一鍵剪輯目前不推、手動還是穩

留言裡幾乎一面倒推 CapCut(剪映)。理由:免費、AI 功能多(自動字幕、文字轉語音、背景去除、動作追蹤)、跨平台。@unlimedia_bl 的提醒值得記下:「初期還不建議 AI 一鍵剪輯。」意思是、AI 自動剪有時候會剪掉你最想保留的鏡頭、新手還是手動拉時間軸最穩。

字節跳動 / 免費 + Pro

留言裡 5 / 11 人推。免費版功能就夠多數人用。台灣 Pro 月費 NT$290、年費 NT$2,490、Pro AI 點數 1,200、雲端 1TB。中國版叫剪映、海外版叫 CapCut、功能略不同。

@moriyama ↗@unlimedia_bl ↗@scicharge001 ↗@kenneth881125 ↗
介面友善 / 適合內容創作者

比 CapCut 更直覺一點、模板多、適合 YouTube / Vlog 風格。年費 USD 49.99、終身買斷 USD 79.99

@unlimedia_bl ↗
特效 / 動態圖形

專業級工具、學習曲線陡、但特效跟動態圖形天花板最高。月費 NT$870、Creative Cloud 全家桶 NT$1,980。

高階特效製片常用、本次留言區未直接提及
調色 / 免費版超強

業界調色第一、免費版功能比很多付費軟體還齊。Studio 版買斷 USD 295、一次到底沒月費。

@kenneth881125 ↗:剪映 + 達芬奇調色
Real Cases · 三個真實案例

看別人怎麼做的、你就知道下一步

從留言裡挑三位有完整工作流分享的創作者、把他們做的影片題材、工具組合、花的時間、踩的雷攤出來。

@moriyama ↗ 營隊宣傳片 10–12 小時 / 40 秒 2026 年 5 月

恐龍都會用 AI、那人類要做什麼?

協助一個團隊操作宣傳影片、概念是「非常規角度」:如果恐龍都會用 AI、那麼人類要做什麼?讓觀眾理解來參加營隊會學到什麼。看精簡工作流原留言 ↗看詳細說明原留言 ↗

工作流:劇本(已完成)→ 分鏡表(每個時間節點 1 至 2 個畫面)→ 角色標準像(每角色 1 張定版圖)→ 各分鏡圖生成(Midjourney 或即夢文生圖)→ 即夢以圖生影(每段 3 至 5 秒、多生幾個備選)→ 剪映整合(快切、轉場、字幕、配樂、配音合併)
主要是跟 Claude 討論劇本框架、可能需要的人物角色特徵、跟劇情的連結性、以及製作角色的 prompt。角色出來之後、再去跟原本分鏡對齊、產出主要畫面、再讓即夢生成影片。大概就是 10 到 12 個小時、基本上是因為第一次做比較完整架構、且時間這麼長的影片、花的時間比較久。原本的時長做到了 1 分鐘、考量到宣傳效益、砍到了約 40 秒。真實感受到電影導演、在做影片剪輯時真的不容易、秒秒都是心血啊。
留言區重點數字:@moriyama 自述第一次做這種完整架構花 10 至 12 小時、1 分鐘原片砍到 40 秒上傳。
@scicharge001 ↗ 火災安全動畫 2–3 分鐘 / 支 系列內容

把專業變動畫:火災安全教育系列

結合本職專業做火災安全教育的動畫片、目標是讓一般人秒懂菸蒂、垃圾桶、馬桶火災迷思。看 Threads 原留言 ↗看 YouTube 影片成果 ↗

工作流:Gemini 彙整腳本和生圖 → Grok Imagine 圖轉影片 → CapCut 剪輯加配音
留言區可觀察的點:「本職專業 + AI 影片」是這位網友選擇的內容路線、影片成品已上 YouTube 可直接看效果。
@itskiro_x ↗ 內容創作 / 駐泰國 進階工作流

用 Nano Banana Pro 把分鏡圖升 4K 再做影片

泰國工作的內容創作者、做的是更講究畫面質感的內容。看 Threads 原留言 ↗

工作流:GPT 生圖 → Seedance 2.0 做影片
進階版:如果圖片細節度需要更準確(複雜服裝、文字、場景)→ 用 Nano Banana Pro 把解析度升到 2K 至 4K → 再用升級後的圖片做影片
無論是真人拍攝、亦或是 AI 影像創作、腳本故事還是關鍵靈魂醬汁。
留言區可觀察的點:「用 A 生圖、用 B 升解析度、再丟給影片模型」是這位網友提出的多模型串接做法、留言裡只有他一人提到。
More Replies · 其他值得看的留言

除了上面三個重點案例、這幾位的工作流也很完整

點過去看 Threads 原留言、能拿到更細節的工具搭配跟踩雷心得。

@kenneth881125 ↗ 完整工作流 含音樂 + 配音

從劇本到音樂的最完整六段流水線

留言區內最完整的單一工作流、涵蓋本文沒展開的「音樂 + 配音」階段。

工作流:Gemini Gem 聊腳本 → Midjourney 做風格基調 + nb2 / GPT 洗三視圖、場景四視圖 → Seedance 2.0 + 可靈 3.0 omni(少數畫面用 Veo)→ 剪映 + 達芬奇調色 → Suno + ACE Studio 做音樂配音
留言區獨有:提到「Gemini Gem」常駐多個場景輔助創作、Suno + ACE Studio 配音樂、達芬奇調色。其他留言都沒到這個深度。
@32filmcompany2021 ↗ 角色 + 場景捏圖法

把 AI 影片當電玩、給角色「道具」做識別

製作邏輯把角色當電玩設計:除了性別年紀髮型衣服、還給道具讓角色可識別差異(手錶、帽子)。場景也一樣捏出列表圖。

工作流:Google Flow 裡用 Nanobanana 免費測試 → 丟 GPT image 2 製作角色列表圖(特寫、側面、表情)→ 場景用同樣邏輯做出參考圖 → 把元素丟入 higgsfield 一站式平台跑影片
留言區獨有:Google Flow(Veo 系列的 web 介面、含免費 Nanobanana)、higgsfield 一站式影片平台、GPT image 2 都是其他留言沒提到的。
@ci.fullstack ↗ 貓咪短片實驗 成本 NT$4

「方法論比工具重要太多了」

參加 AI 影片工作坊後、回家試做一支貓咪短片的學習日誌。第一版 text-to-video 生出 5 隻完全不同的貓笑到不行、改用 image-to-video 一鏡一鏡固定角色卡後才搞定。

從錯誤學到的事:純 text-to-video 不穩 → 先做角色卡固定長相 → image-to-video 一鏡一鏡生 → 五次迭代才搞定
最終成本:NT$4(不含時間)
留言區獨有:明確點出 text-to-video 與 image-to-video 的工作流差異、給了一個具體單支成本數字(NT$4)。
@champ_roses.hotel ↗ 花蓮飯店宣傳片

「安娜公主的花蓮假期」動畫工作流

花蓮飯店業主、製作主題動畫宣傳片「安娜公主的花蓮假期」、靈感來自「嘉明湖神秘照片事件」+ 電影「羅馬假期」。

工作流:Gemini 當劇本醫生加表情語氣 → ChatGPT 做人物設定 + 分鏡 → Seedance 2.0 生成影片 → Perfect Video 剪接(自評「剪映更好」)
留言區獨有:提到剪接用了 Perfect Video 但自評「剪映更好」、是少數寫了「事後檢討」的留言。
Cost Reference · 公告價試算

把網友提到的工具組成幾組、官方公告價是多少?

純粹照 2026 年 5 月官方公告價組合、不含人力時間、不含算力波動。實際支出取決於用量、可能高於或低於此處數字。

組合類型 工具組合 月費 / 用量成本 對應留言場景
最低訂閱組 ChatGPT Plus + 即夢免費額度 + CapCut 免費版 USD 20 / 月
用量 0–5 元 / 支
無留言對應、純試水溫推算
網友常見組合 Gemini 免費 + Midjourney Standard + Seedance 2.0(Dreamina Basic)+ CapCut Pro 約 USD 60 / 月
用量 0–3 元 / 支
對應 @kenneth881125、@itskiro_x 工作流量級
外案製片組合 Claude Pro + Midjourney Pro + Runway Pro + Seedance API + CapCut Pro + DaVinci Studio 約 USD 150 / 月
單案算力 USD 20–80
對應 @kenneth881125 完整六段工作流量級
純 API 組合 Nano Banana Pro API + Seedance 2.0 API + 自寫剪輯 單支 USD 5–30 純算力
無月費
無留言對應、API 公告價推算

數字觀察:

  1. 探索門檻不到月費 USD 20。各家都有免費額度、加上 ChatGPT Plus 或 Gemini 免費版、純試水溫成本接近零。
  2. 每月 USD 60 左右可組到主流組合(Midjourney Standard + 即夢 + CapCut Pro 量級)、能不能撐住產量還是要實測。
  3. 時間成本未列入。@moriyama 自述一支 40 秒影片做 10 至 12 小時、若計入時間、整體成本會大幅高於月費。
"

無論是真人拍攝、亦或是 AI 影像創作、
腳本故事還是關鍵靈魂醬汁

引自 @itskiro_x · Threads 串文留言
Patterns · 留言區出現的共同模式

把 15 位網友的工作流並排看、會看到三個共同點

這不是評論誰對誰錯、是把不同工作流並排觀察出的傾向。實際是否成立、要靠自己實測。

共同點 1

「劇本」是大家不約而同強調最花時間的環節

@unlimedia_bl 寫明花腦袋約占 70% 總時間@xxmrshanxx 直接「首先好的腳本、再來就是砸錢生成」、@itskiro_x 形容劇本是「關鍵靈魂醬汁」、@ci.fullstack 試完貓咪短片後寫「方法論比工具重要太多了」。15 位留言裡至少 5 位獨立提到劇本是瓶頸、各自描述方式不同、但指向同一件事。

共同點 2

順序大致相同、選用工具高度發散

15 位留言的流程順序幾乎一致(劇本 → 分鏡 → 角色 → 生影片 → 剪輯)、但每階段選的工具差異很大。光是圖生影片這一階段、就出現 Seedance / 即夢 / Kling / Runway / Grok 五個不同工具、沒有壓倒性主流。意味著「方法論已收斂、工具尚未收斂」、這對打算入門的人是觀察重點。

共同點 3

有「本職專業」的人、做出來的內容路線最清晰

留言區裡@scicharge001 做消防安全動畫、@champ_roses.hotel 把飯店服務變花蓮主題動畫、@moriyama 做營隊宣傳片。主題明確、內容路線就清晰、跟純粹工具技藝展示的影片做出來感受不同。這只是觀察、是否成因要更多樣本才能驗證。

Summary · 整理三句

這篇文章在說什麼

01

15 位網友的工作流在順序上高度一致:劇本 → 分鏡 → 角色標準像 → 圖生影片 → 剪輯。階段內選什麼工具各有偏好。

02

工具規格已查證至 2026 年 5 月官方公告值。價格、解析度、時長以本文發布日為準、之後可能變動。實際好不好用、要自己跑一輪。

03

本文是社群觀察、不是實測評論。所有「誰推薦什麼」都來自 Threads 留言原文、不代表作者背書或建議。打算入門的人可以拿這份對照清單當起點、再用自己關心的題材試做。

來源完整索引(依本文出現順序)

這篇是社群觀察整理、來源是一篇引爆 Threads 的討論串、再對工具上網查證公告規格。

作者尚未實測這些工作流。如果你有實測經驗、歡迎到 @leadingmrk 分享、會更新到後續文章。

老K · 領先時代數位

撰寫 2026-05-21 · 最後更新 2026-05-21

看完這篇?回首頁瀏覽更多實驗筆記

← 回 老K 的 AI 實驗筆記