實測心得｜ 2026-05-17 ｜ AI 工具實測

我用 AI 自動化公司 Paperclip
跑了兩個商業模式

整理五個我嘗試後的觀察，以及為什麼我決定「先不用它」。這份報告把整個踩坑過程、學到的概念、跟其他平台比較整理好，給你 30 分鐘的判斷材料。

實測 24 小時兩個商業模式五個觀察 + 三平台比較

⚡ 30 秒看重點

Paperclip 是真的能跑、視覺化做得很好的多 agent 編排平台，10 分鐘就讓 AI 自動 ship 出 Next.js 中文 landing page。但有幾個 marketing 沒講清楚的限制（成本黑箱、依賴 Anthropic API、客製化偏低）、最後我決定不採用、回到自己的 Claude Code stack。這篇把整個踩坑過程、Hermes / OpenClaw 三平台對照、學到的概念整理好，給想試的人省 24 小時。

起點

為什麼我會去玩 Paperclip？

朋友在 Threads 推坑說「2026 最火的 AI Agent 工具」。我看了 GitHub，3 週衝到 30k stars、官方文案「為零人類公司打造的開源編排框架」，確實夠戲劇化。

更重要的是，我自己已經用 Claude Code 手刻了一套 12 位 AI 主管團，每位主管有專屬的角色、職責、工作 SOP。我想知道：Paperclip 這種「視覺化多 agent 編排」跟我手刻的 markdown 主管團，到底誰好用、可以互相補位嗎？

我嘗試了什麼

裝好 Paperclip 搭配 Claude 月費方案，跑了兩個應用

應用 1

一人事業 × AI 訂閱社群

我還在初嘗試的階段，沒想到它十分鐘內就自動請了一位員工、架設出一個預售用的 Landing Page。我擔心會失控，先按暫停，重新想要它做什麼獨立的新創業項目。

應用 2

Notion 模板設計公司

AI 自動建出 4 套企業用的 Notion 模板（業務管理、目標追蹤、工程衝刺、個人理財），含內嵌資料庫、自動上線。但實際打開發現品質有大問題（後面會講）。

共通條件

全程走 Claude 月費方案、沒額外花錢

用 claude_local adapter 接我已登入的 Claude Code，所有 LLM 呼叫吃我訂閱方案的額度。整套實驗總共大約 17.7k tokens、不到我 5 小時視窗額度的 1%。

核心收穫

4 個我嘗試後的觀察

重點 01

它不會自主成長

因為我串接的是一般的 Claude 對話，不是有自動累積技能機制的 Hermes 這類能自我學習的 AI 框架。

在這個組合下，Paperclip 只是把多個 Claude 對話組成有組織結構的團隊而已。它提供的是「結構」（組織圖、任務追蹤、定時喚醒、成本計算），不是「進化」。

把它當「給目標、AI 自走、公司自運轉」期待錯了會超失望。

重點 02

預設的自動雇用品質很爛

Paperclip 號稱「會自動幫你請員工」，但請出來用的是通用英文模板，完全不貼你的需求、不知道你的領域、不知道你的口吻。

Threads 上有個用戶留言點破：

「不能依靠他本來的請員工功能，你要先研究員工的規格，然後確保你後來請的每一個員工都合規格。」

— Threads 用戶 @lablamb_works_limited（中譯）

翻譯：你必須自己做一份「員工標準範本」，未來每個新員工都套這份、不要靠 Paperclip 預設。這是它最大的隱藏成本。

重點 03

動態學習過一晚就消失

你寫死的設定會持久保留（這就是為什麼中文化指令能成功）。但這次任務踩坑學到的新東西，沒有機制自動寫回設定裡。下次同樣任務還是要從頭學一遍。

Hermes 跟 OpenClaw 那類能自我學習的 AI 框架想解決的，就是這件事。它們會自動把成功的工作流程沉澱成可重用技能，下次自動套用。

重點 04

真正的天花板在工具本身

派 AI 做 Notion 模板，它會用工具，但作品品質很糟。追下去發現根本原因：

Notion 開放給外部程式串接的功能不夠完整（特別是內嵌資料庫等核心功能），AI 能用的「材料」就那些。

我把跟米米合開的 Notion 模板設計課餵給 AI 學，做出來依舊粗淺。改讓 AI 用自動化瀏覽器直接操作介面排版，又笨拙到不能用。

結論：AI 做 Notion 模板這條路，現階段卡在 Notion 本身。不是 AI 不夠聰明、是工具本身的限制。

該不該用

誰適合用 Paperclip？誰不適合？

你是 AI 工具新手想看多 agent 公司長什麼樣

值得試

你要做沙盒實驗給 brief 拿一次性 prototype

適合

你想視覺化看多 agent 協作而不只是 CLI 輸出

適合

你已有客製化的 Claude Code stack（Skill / Memory / Agent 都自己刻過）

不用換

你要它接管實際業務（客戶 facing、緊急救火、需要你判斷的事）

不適合

你期待「丟著它自己學會變強」

會失望

你想 24/7 常駐自走處理重複性任務

建議用 Hermes

分層架構

這三個其實不是 PK，是分層架構

研究過程順手把另外兩個熱門平台也比較過。一個重要的觀察：Paperclip 跟 Hermes / OpenClaw 不在同一個比較天平上。它們是不同層的東西。

組織層｜像「公司」

Paperclip：負責組織結構、定時喚醒、任務分派、多角色協作。它是公司結構本身、不是員工。

執行層｜像「員工」

Hermes（Nous Research 出）：會自己累積技能、有三層記憶系統（核心、對話歷史、自動沉澱的程序性技能）
OpenClaw：深度角色設定、長期記憶、單一 agent 持續運行

最佳組合

邏輯上應該是 Paperclip + Hermes 或 Paperclip + OpenClaw。官方真的有 hermes-paperclip-adapter 跟 paperclip-openclaw-plugin，把「組織層 + 自我學習執行層」串起來。

我這次的組合

Paperclip + 一般 Claude 對話（claude_local adapter）= 公司結構有了，但員工太陽春，所以踩了一堆坑。

註：社群還在發展的相關工具不只這三個，這篇選了最熱門且有完整文件的三個對比，其他新生工具留待後續觀察。

最大的意外

我已經用 Claude Code 打造出相似 Hermes 的用法

挖完 Hermes 的架構後，我發現一件讓我意外的事：我親手建立的 Claude Code 工作區，跟 Hermes 的三層記憶幾乎一比一對應。

Hermes 的設計	我已經有的
核心記憶檔（約 1.3k token）	80+ 份 memory 檔案 + 索引
對話歷史可搜尋資料庫	Claude Code 內建對話歷史
自動累積技能資料夾	28 個自訂技能 + 12 位 AI 主管
定時喚醒排程	n8n 18 個自動化流程 + 定時 loop
外部工具整合	幾百個 MCP 工具已串
多訊息平台	Discord 27 頻道 + LINE bot + 7 個 Gmail 帳號

差別只在一個關鍵點：

Hermes 是「通用版」— 適合不想花時間設計的人，技能自動沉澱
我的 Claude Code 是「為自己客製化幾百小時的版本」— 更貼業務、品質更高、但要自己出力沉澱

有機會也想玩看看 Hermes，但目前用 Claude Code 已經夠用。換 Hermes 對我來說等於拋棄幾百小時的客製化、失去 Claude 月費方案、失去 Claude Code 的肌肉記憶。

而 Paperclip 又解決不了我真正的痛點。所以收工、回主架構。

偷回來的概念

4 個值得帶走的觀察跟啟發

不採用 Paperclip / Hermes，不代表這 24 小時白花。我從它們的設計裡偷到 4 個概念，部分已搬回 Claude Code 工作流、部分還在嘗試中：

AI 員工的組織與互通

清楚的組織結構、能分派任務、互相溝通、記憶互通、自主學習、任務自行驗證。這是 Paperclip 整套設計的核心啟發。

自動保存與沉澱

把做過的事、看過的對話、外部資訊自動保存下來，累積成技能或記憶。這是 Hermes 比一般 Claude 對話多的核心能力。

定時喚醒機制

或許可以用 Claude 的定時呼叫功能（loop），讓每個角色定時喚醒、主動推進專案，不一定要依賴 Paperclip 的心跳系統。

領域知識預備

AI 還是需要訓練的。自己備好領域知識、或能餵給它什麼知識，比換工具更影響產出品質。

給你的建議

如果你也想試 Paperclip

不要被「零人類公司」這個 marketing 騙了，但也不要錯過親手碰一次的價值。下面是我建議的試法：

給自己一個明確時間預算：建議 4-6 小時。超過就停手、檢視值不值得。
用一個全新沙盒題目：跟你的真實業務無關。讓 agent 自由發揮、你純觀察。
第一個任務就試 Notion MCP 或其他外部系統整合：這是 Paperclip 跟單一 CLI 差別最大的地方。
觀察 agent 走偏的方式：它一定會走偏，看走偏在哪、補哪段 instructions 能矯正。這比 ship 出產品更值錢。
玩完後做兩件事：（a）把學到的 framework 偷回你既有 stack；（b）誠實評估：對你的業務真的有 ROI 嗎？

多數時候答案是「沒有」。但你只有玩過才知道。

完整啟用教學

動手玩玩看：30 分鐘從零跑起 Paperclip

看完心得想自己試？這份指南帶你從安裝到第一個任務跑出結果，每步都告訴你會看到什麼、可能卡在哪。

它是什麼

2026 年 3 月開源的多代理編排平台，由 @dotta 發起。GitHub 短時間內累積大量 stars、社群活躍。核心理念：用「公司結構」管理多個 AI agent、讓它們協作完成任務。

官網：paperclip.ing
GitHub：paperclipai/paperclip
NPM 套件：paperclipai

Step 1 ｜確認電腦準備好

打開終端機（macOS Terminal / Linux Bash / Windows 用 WSL），確認以下三件事：

# 1. Node.js 20 或以上（顯示 v20.x 或更新）
node --version

# 2. Claude Code CLI 已裝 + 已登入
claude --version

# 3. 確認登入狀態（會顯示你的 Claude 帳號）
claude doctor

沒裝 Node.js？到 nodejs.org 下載 LTS 版裝起來。

沒裝 Claude Code？看官方文件，跑 npm install -g @anthropic-ai/claude-code 然後 claude login。

還沒有 Claude 月費方案？Paperclip 在這個組合下會直接吃你訂閱方案額度、不用另外付 API token 費。沒訂閱也能用、但要設定 Anthropic API key 走計費模式。

Step 2 ｜一行指令安裝 + 啟動

開個全新目錄當沙盒（重要：不要在你既有的工作目錄跑，Paperclip 會在當下目錄建立各種設定檔，可能污染你正式專案）：

mkdir ~/Developer/paperclip-test
cd ~/Developer/paperclip-test
npx -y paperclipai onboard --yes

第一次跑會下載套件（約 30-60 秒）、然後自動：

下載 + 啟動內建 PostgreSQL 資料庫
產生 JWT 安全密鑰、master.key 加密金鑰
建立 instance 設定檔在 ~/.paperclip/instances/default/
跑 9 個 doctor check（全部 ✅ 才會繼續）
啟動 server 在 http://127.0.0.1:3100

看到「Starting Paperclip server...」+「Using embedded PostgreSQL...」就表示 OK。

Step 3 ｜打開瀏覽器看 dashboard

瀏覽器開 http://127.0.0.1:3100。第一次進去 Paperclip 會自動跑 onboarding，建立一個示範公司、給你一個基本設定。

你會看到左側 sidebar 有：

Dashboard ｜全公司即時狀態（誰在跑、跑什麼、花多少）
Inbox ｜需要你決策的事項
Issues ｜所有任務
Routines ｜定時喚醒排程
Goals ｜公司目標
Org ｜組織架構（agent 員工列表）
Skills ｜ Agent 可用技能
Costs ｜成本追蹤
Activity ｜操作紀錄
Settings ｜公司設定

Step 4 ｜改公司名稱、調整 CEO 設定

預設公司名是英文，建議改成你的目標：

點左上角公司名稱 → Edit → 改成你的公司名（例如「測試公司」「狗狗 App 工作室」）
點左下角 Org → 點 CEO → Instructions tab → 在 AGENTS.md 開頭加一段中文指令（例如「請所有回覆用繁體中文，技術術語保留英文不翻譯」）
儲存後新任務就會用中文

Step 5 ｜下你的第一個 brief

建議一開始用「沙盒題目」、跟你真實業務無關：

「設計一個給狗主人用的飲食追蹤 App」
「開一間賣手作蠟燭的線上店，月營收目標 5 萬」
「給高中生用的英檢準備系統」
「規劃一個小型 Podcast 節目營運計畫，目標 100 集」

操作：左上 + New Issue → Title 寫目標 → Description 給高層次商業 brief（不要給細節）→ Assign 給 CEO → Submit。

給高層次目標、看 agent 怎麼自己拆任務。我這次給的目標是「一人事業 × AI Agent 訂閱社群，月收 10 萬」，十分鐘就拿到一個完整的中文預售網站。

Step 6 ｜觀察 CEO 怎麼跑

提交 issue 後 CEO 會：

讀你的 brief、寫一份 plan document（可在 issue 內看到）
自動拆出 3-5 個子任務（child issue）
如果需要其他角色（工程師、設計師），會自動「雇用」新 agent
派子任務給對應 agent、開始執行

整個過程你可以在 Dashboard 看到即時狀態。每個 agent 動一次叫一個「heartbeat run」，可以點進去看完整工作紀錄。

常用指令

暫停某個 agent：UI 上點 Pause（agent 詳細頁右上角）
停掉整個 server：終端機按 Ctrl+C
重新啟動 server（保留所有資料）：npx paperclipai run
完全清除（歸零）：rm -rf ~/.paperclip ~/Developer/paperclip-test

常見卡點排除

瀏覽器打開是 404：server 還沒完全啟動，等 10-20 秒再 refresh
CEO 跑出來的內容是英文：還沒設中文 instructions（Step 4），新任務會用設定後的語言
agent 一直在跑、不知道在幹嘛：UI 上點 Pause、然後到 Activity tab 看完整紀錄
port 3100 被佔用：看是不是還有舊 instance 在跑、或改 port（在 ~/.paperclip 設定）
Notion / Google MCP 連不上：子 agent 不會自動繼承你 Claude Code 的 MCP 設定，要在 Paperclip 公司層級另外設

重要安全提醒

不要接 production 級的 MCP 工具（特別是有寫入權限的 Notion、Gmail、資料庫）。我這次測試時 CEO 自己選了我的諮詢復盤頁當父頁面，差點污染正式工作區
不要把客戶資料、敏感檔案放進工作目錄。Agent 會自由讀取、且這次學到的東西不會自動寫回設定
第一次玩用沙盒題目就好。看清楚它能做什麼、再決定要不要接真實業務

玩完之後想要更多？

如果你想要 agent 能真的累積技能、跨對話記憶，可以研究這兩個替代方案：

Hermes Agent（Nous Research 出）— 三層記憶 + 自動把成功 workflow 轉成技能
OpenClaw — 常駐單一 agent、深度角色設定、長期記憶
進階組合：用官方 hermes-paperclip-adapter 把 Hermes 接到 Paperclip 公司結構裡，組合「組織層 + 自我學習執行層」

玩完歡迎來 @leadingmrk 分享你的觀察。每個人的場景不同、別人的踩坑不一定是你的、你的領悟可能補我沒看到的盲點。

AI 工具可以持續研究，但不一定要全盤接受

重點是你當下的需求與工作流，能否用你目前會的技術解決。

如果可以，那就別追逐最新趨勢，先解決問題更重要。

三個月後 follow-up

2026-08 預計回來再看一次

AI Agent 工具迭代很快、三個月後我會回來這篇更新立場：Paperclip 有沒有補上限制、Claude Code 是不是接出更好的多 agent 模式、或者出現新的競品讓我改主意。

追蹤這篇的人會在 @leadingmrk 看到更新通知。或者你三個月後直接回來看這段文末有沒有新註記。

📌 2026-08 更新：（待補）