實測心得 | 2026-05-17 | AI 工具實測

我用 AI 自動化公司 Paperclip
跑了兩個商業模式

整理五個我嘗試後的觀察,以及為什麼我決定「先不用它」。這份報告把整個踩坑過程、學到的概念、跟其他平台比較整理好,給你 30 分鐘的判斷材料。

實測 24 小時 兩個商業模式 五個觀察 + 三平台比較
⚡ 30 秒看重點

Paperclip 是真的能跑、視覺化做得很好的多 agent 編排平台,10 分鐘就讓 AI 自動 ship 出 Next.js 中文 landing page。但有幾個 marketing 沒講清楚的限制(成本黑箱、依賴 Anthropic API、客製化偏低)、最後我決定不採用、回到自己的 Claude Code stack。這篇把整個踩坑過程、Hermes / OpenClaw 三平台對照、學到的概念整理好,給想試的人省 24 小時。

起點

為什麼我會去玩 Paperclip?

朋友在 Threads 推坑說「2026 最火的 AI Agent 工具」。我看了 GitHub,3 週衝到 30k stars、官方文案「為零人類公司打造的開源編排框架」,確實夠戲劇化。

更重要的是,我自己已經用 Claude Code 手刻了一套 12 位 AI 主管團,每位主管有專屬的角色、職責、工作 SOP。我想知道:Paperclip 這種「視覺化多 agent 編排」跟我手刻的 markdown 主管團,到底誰好用、可以互相補位嗎?

我嘗試了什麼

裝好 Paperclip 搭配 Claude 月費方案,跑了兩個應用

應用 1
一人事業 × AI 訂閱社群
我還在初嘗試的階段,沒想到它十分鐘內就自動請了一位員工、架設出一個預售用的 Landing Page。我擔心會失控,先按暫停,重新想要它做什麼獨立的新創業項目。
應用 2
Notion 模板設計公司
AI 自動建出 4 套企業用的 Notion 模板(業務管理、目標追蹤、工程衝刺、個人理財),含內嵌資料庫、自動上線。但實際打開發現品質有大問題(後面會講)。
共通條件
全程走 Claude 月費方案、沒額外花錢
用 claude_local adapter 接我已登入的 Claude Code,所有 LLM 呼叫吃我訂閱方案的額度。整套實驗總共大約 17.7k tokens、不到我 5 小時視窗額度的 1%。
核心收穫

4 個我嘗試後的觀察

重點 01

它不會自主成長

因為我串接的是一般的 Claude 對話,不是有自動累積技能機制Hermes 這類能自我學習的 AI 框架。

在這個組合下,Paperclip 只是把多個 Claude 對話組成有組織結構的團隊而已。它提供的是「結構」(組織圖、任務追蹤、定時喚醒、成本計算),不是「進化」。

把它當「給目標、AI 自走、公司自運轉」期待錯了會超失望。

重點 02

預設的自動雇用品質很爛

Paperclip 號稱「會自動幫你請員工」,但請出來用的是通用英文模板,完全不貼你的需求、不知道你的領域、不知道你的口吻。

Threads 上有個用戶留言點破:

「不能依靠他本來的請員工功能,你要先研究員工的規格,然後確保你後來請的每一個員工都合規格。」

— Threads 用戶 @lablamb_works_limited(中譯)

翻譯:你必須自己做一份「員工標準範本」,未來每個新員工都套這份、不要靠 Paperclip 預設。這是它最大的隱藏成本。

重點 03

動態學習過一晚就消失

你寫死的設定會持久保留(這就是為什麼中文化指令能成功)。但這次任務踩坑學到的新東西,沒有機制自動寫回設定裡。下次同樣任務還是要從頭學一遍。

Hermes 跟 OpenClaw 那類能自我學習的 AI 框架想解決的,就是這件事。它們會自動把成功的工作流程沉澱成可重用技能,下次自動套用。

重點 04

真正的天花板在工具本身

派 AI 做 Notion 模板,它會用工具,但作品品質很糟。追下去發現根本原因:

Notion 開放給外部程式串接的功能不夠完整(特別是內嵌資料庫等核心功能),AI 能用的「材料」就那些。

我把跟米米合開的 Notion 模板設計課餵給 AI 學,做出來依舊粗淺。改讓 AI 用自動化瀏覽器直接操作介面排版,又笨拙到不能用。

結論:AI 做 Notion 模板這條路,現階段卡在 Notion 本身。不是 AI 不夠聰明、是工具本身的限制。

該不該用

誰適合用 Paperclip?誰不適合?

你是 AI 工具新手想看多 agent 公司長什麼樣
值得試
你要做沙盒實驗給 brief 拿一次性 prototype
適合
你想視覺化看多 agent 協作而不只是 CLI 輸出
適合
你已有客製化的 Claude Code stack(Skill / Memory / Agent 都自己刻過)
不用換
你要它接管實際業務(客戶 facing、緊急救火、需要你判斷的事)
不適合
你期待「丟著它自己學會變強」
會失望
你想 24/7 常駐自走處理重複性任務
建議用 Hermes
分層架構

這三個其實不是 PK,是分層架構

研究過程順手把另外兩個熱門平台也比較過。一個重要的觀察:Paperclip 跟 Hermes / OpenClaw 不在同一個比較天平上。它們是不同層的東西。

組織層 | 像「公司」

  • Paperclip:負責組織結構、定時喚醒、任務分派、多角色協作。它是公司結構本身、不是員工。

執行層 | 像「員工」

  • Hermes(Nous Research 出):會自己累積技能、有三層記憶系統(核心、對話歷史、自動沉澱的程序性技能)
  • OpenClaw:深度角色設定、長期記憶、單一 agent 持續運行

最佳組合

邏輯上應該是 Paperclip + HermesPaperclip + OpenClaw。官方真的有 hermes-paperclip-adapter 跟 paperclip-openclaw-plugin,把「組織層 + 自我學習執行層」串起來。

我這次的組合

Paperclip + 一般 Claude 對話(claude_local adapter)= 公司結構有了,但員工太陽春,所以踩了一堆坑。

註:社群還在發展的相關工具不只這三個,這篇選了最熱門且有完整文件的三個對比,其他新生工具留待後續觀察。

最大的意外

我已經用 Claude Code 打造出相似 Hermes 的用法

挖完 Hermes 的架構後,我發現一件讓我意外的事:我親手建立的 Claude Code 工作區,跟 Hermes 的三層記憶幾乎一比一對應。

Hermes 的設計 我已經有的
核心記憶檔(約 1.3k token)80+ 份 memory 檔案 + 索引
對話歷史可搜尋資料庫Claude Code 內建對話歷史
自動累積技能資料夾28 個自訂技能 + 12 位 AI 主管
定時喚醒排程n8n 18 個自動化流程 + 定時 loop
外部工具整合幾百個 MCP 工具已串
多訊息平台Discord 27 頻道 + LINE bot + 7 個 Gmail 帳號

差別只在一個關鍵點:

  • Hermes 是「通用版」— 適合不想花時間設計的人,技能自動沉澱
  • 我的 Claude Code 是「為自己客製化幾百小時的版本」— 更貼業務、品質更高、但要自己出力沉澱

有機會也想玩看看 Hermes,但目前用 Claude Code 已經夠用。換 Hermes 對我來說等於拋棄幾百小時的客製化、失去 Claude 月費方案、失去 Claude Code 的肌肉記憶。

而 Paperclip 又解決不了我真正的痛點。所以收工、回主架構。

偷回來的概念

4 個值得帶走的觀察跟啟發

不採用 Paperclip / Hermes,不代表這 24 小時白花。我從它們的設計裡偷到 4 個概念,部分已搬回 Claude Code 工作流、部分還在嘗試中:

1

AI 員工的組織與互通

清楚的組織結構、能分派任務、互相溝通、記憶互通、自主學習、任務自行驗證。這是 Paperclip 整套設計的核心啟發。

2

自動保存與沉澱

把做過的事、看過的對話、外部資訊自動保存下來,累積成技能或記憶。這是 Hermes 比一般 Claude 對話多的核心能力。

3

定時喚醒機制

或許可以用 Claude 的定時呼叫功能(loop),讓每個角色定時喚醒、主動推進專案,不一定要依賴 Paperclip 的心跳系統。

4

領域知識預備

AI 還是需要訓練的。自己備好領域知識、或能餵給它什麼知識,比換工具更影響產出品質。

給你的建議

如果你也想試 Paperclip

不要被「零人類公司」這個 marketing 騙了,但也不要錯過親手碰一次的價值。下面是我建議的試法:

  1. 給自己一個明確時間預算:建議 4-6 小時。超過就停手、檢視值不值得。
  2. 用一個全新沙盒題目:跟你的真實業務無關。讓 agent 自由發揮、你純觀察。
  3. 第一個任務就試 Notion MCP 或其他外部系統整合:這是 Paperclip 跟單一 CLI 差別最大的地方。
  4. 觀察 agent 走偏的方式:它一定會走偏,看走偏在哪、補哪段 instructions 能矯正。這比 ship 出產品更值錢。
  5. 玩完後做兩件事:(a)把學到的 framework 偷回你既有 stack;(b)誠實評估:對你的業務真的有 ROI 嗎?

多數時候答案是「沒有」。但你只有玩過才知道。

完整啟用教學

動手玩玩看:30 分鐘從零跑起 Paperclip

看完心得想自己試?這份指南帶你從安裝到第一個任務跑出結果,每步都告訴你會看到什麼、可能卡在哪。

它是什麼

2026 年 3 月開源的多代理編排平台,由 @dotta 發起。GitHub 短時間內累積大量 stars、社群活躍。核心理念:用「公司結構」管理多個 AI agent、讓它們協作完成任務。

Step 1 | 確認電腦準備好

打開終端機(macOS Terminal / Linux Bash / Windows 用 WSL),確認以下三件事:

# 1. Node.js 20 或以上(顯示 v20.x 或更新)
node --version

# 2. Claude Code CLI 已裝 + 已登入
claude --version

# 3. 確認登入狀態(會顯示你的 Claude 帳號)
claude doctor

沒裝 Node.js?nodejs.org 下載 LTS 版裝起來。

沒裝 Claude Code?官方文件,跑 npm install -g @anthropic-ai/claude-code 然後 claude login

還沒有 Claude 月費方案?Paperclip 在這個組合下會直接吃你訂閱方案額度、不用另外付 API token 費。沒訂閱也能用、但要設定 Anthropic API key 走計費模式。

Step 2 | 一行指令安裝 + 啟動

開個全新目錄當沙盒(重要:不要在你既有的工作目錄跑,Paperclip 會在當下目錄建立各種設定檔,可能污染你正式專案):

mkdir ~/Developer/paperclip-test
cd ~/Developer/paperclip-test
npx -y paperclipai onboard --yes

第一次跑會下載套件(約 30-60 秒)、然後自動:

  • 下載 + 啟動內建 PostgreSQL 資料庫
  • 產生 JWT 安全密鑰、master.key 加密金鑰
  • 建立 instance 設定檔在 ~/.paperclip/instances/default/
  • 跑 9 個 doctor check(全部 ✅ 才會繼續)
  • 啟動 server 在 http://127.0.0.1:3100

看到「Starting Paperclip server...」+「Using embedded PostgreSQL...」就表示 OK。

Step 3 | 打開瀏覽器看 dashboard

瀏覽器開 http://127.0.0.1:3100。第一次進去 Paperclip 會自動跑 onboarding,建立一個示範公司、給你一個基本設定。

你會看到左側 sidebar 有:

  • Dashboard | 全公司即時狀態(誰在跑、跑什麼、花多少)
  • Inbox | 需要你決策的事項
  • Issues | 所有任務
  • Routines | 定時喚醒排程
  • Goals | 公司目標
  • Org | 組織架構(agent 員工列表)
  • Skills | Agent 可用技能
  • Costs | 成本追蹤
  • Activity | 操作紀錄
  • Settings | 公司設定

Step 4 | 改公司名稱、調整 CEO 設定

預設公司名是英文,建議改成你的目標:

  1. 點左上角公司名稱 → Edit → 改成你的公司名(例如「測試公司」「狗狗 App 工作室」)
  2. 點左下角 Org → 點 CEO → Instructions tab → 在 AGENTS.md 開頭加一段中文指令(例如「請所有回覆用繁體中文,技術術語保留英文不翻譯」)
  3. 儲存後新任務就會用中文

Step 5 | 下你的第一個 brief

建議一開始用「沙盒題目」、跟你真實業務無關:

  • 「設計一個給狗主人用的飲食追蹤 App」
  • 「開一間賣手作蠟燭的線上店,月營收目標 5 萬」
  • 「給高中生用的英檢準備系統」
  • 「規劃一個小型 Podcast 節目營運計畫,目標 100 集」

操作:左上 + New Issue → Title 寫目標 → Description 給高層次商業 brief(不要給細節)→ Assign 給 CEO → Submit。

給高層次目標、看 agent 怎麼自己拆任務。我這次給的目標是「一人事業 × AI Agent 訂閱社群,月收 10 萬」,十分鐘就拿到一個完整的中文預售網站。

Step 6 | 觀察 CEO 怎麼跑

提交 issue 後 CEO 會:

  1. 讀你的 brief、寫一份 plan document(可在 issue 內看到)
  2. 自動拆出 3-5 個子任務(child issue)
  3. 如果需要其他角色(工程師、設計師),會自動「雇用」新 agent
  4. 派子任務給對應 agent、開始執行

整個過程你可以在 Dashboard 看到即時狀態。每個 agent 動一次叫一個「heartbeat run」,可以點進去看完整工作紀錄。

常用指令

  • 暫停某個 agent:UI 上點 Pause(agent 詳細頁右上角)
  • 停掉整個 server:終端機按 Ctrl+C
  • 重新啟動 server(保留所有資料):npx paperclipai run
  • 完全清除(歸零):rm -rf ~/.paperclip ~/Developer/paperclip-test

常見卡點排除

  • 瀏覽器打開是 404:server 還沒完全啟動,等 10-20 秒再 refresh
  • CEO 跑出來的內容是英文:還沒設中文 instructions(Step 4),新任務會用設定後的語言
  • agent 一直在跑、不知道在幹嘛:UI 上點 Pause、然後到 Activity tab 看完整紀錄
  • port 3100 被佔用:看是不是還有舊 instance 在跑、或改 port(在 ~/.paperclip 設定)
  • Notion / Google MCP 連不上:子 agent 不會自動繼承你 Claude Code 的 MCP 設定,要在 Paperclip 公司層級另外設

重要安全提醒

  • 不要接 production 級的 MCP 工具(特別是有寫入權限的 Notion、Gmail、資料庫)。我這次測試時 CEO 自己選了我的諮詢復盤頁當父頁面,差點污染正式工作區
  • 不要把客戶資料、敏感檔案放進工作目錄。Agent 會自由讀取、且這次學到的東西不會自動寫回設定
  • 第一次玩用沙盒題目就好。看清楚它能做什麼、再決定要不要接真實業務

玩完之後想要更多?

如果你想要 agent 能真的累積技能、跨對話記憶,可以研究這兩個替代方案:

  • Hermes Agent(Nous Research 出)— 三層記憶 + 自動把成功 workflow 轉成技能
  • OpenClaw — 常駐單一 agent、深度角色設定、長期記憶
  • 進階組合:用官方 hermes-paperclip-adapter 把 Hermes 接到 Paperclip 公司結構裡,組合「組織層 + 自我學習執行層」

玩完歡迎來 @leadingmrk 分享你的觀察。每個人的場景不同、別人的踩坑不一定是你的、你的領悟可能補我沒看到的盲點。

AI 工具可以持續研究,但不一定要全盤接受

重點是你當下的需求與工作流,能否用你目前會的技術解決。

如果可以,那就別追逐最新趨勢,先解決問題更重要。

三個月後 follow-up

2026-08 預計回來再看一次

AI Agent 工具迭代很快、三個月後我會回來這篇更新立場:Paperclip 有沒有補上限制、Claude Code 是不是接出更好的多 agent 模式、或者出現新的競品讓我改主意。

追蹤這篇的人會在 @leadingmrk 看到更新通知。或者你三個月後直接回來看這段文末有沒有新註記。

📌 2026-08 更新:(待補)

看完這篇?回首頁瀏覽更多實驗筆記

← 回 老K 的 AI 實驗筆記