2026年2月21日 星期六

如何為下個版本的模型而建:Claude Code 的誕生、設計原則與未來展望

本次訪談主角為 Claude Code 創造工程師 Boris Churnney,談話聚焦產品起源、設計抉擇、使用者行為觀察、以及面向快速進化的大型語言模型(LLM)的實務策略與願景。

起源與最初設計:Claude Code 最初只是個在終端機(CLI)運行的輕量原型,用來試 API、驗證工具使用(tool use)概念與快速 dogfooding。之所以選終端,是因為最便宜、最快速能驗證「模型能否實際幫助寫程式」。許多早期功能與 UX 都由內部使用者逐步驅動演化。

終端意外成為核心設計:雖然 Boris 一開始認為終端只會是起點,但 CLI 的簡潔限制反而成為優勢:開發者把注意力放在任務流程上而非檔案/UI,體驗既輕快又有趣,且容易快速迭代。後來才拓展到桌面、Web、iOS/Android、VS Code / JetBrains 等多個介面,但底層 agent 邏輯一致。

產品原則:建構「六個月後的模型」

  • 不要只為當前模型做產品:Boris 的核心建議是「不為今日模型而建,為六個月後的模型而建」,也就是設計時預想模型快速進步的邊界與能力。
  • 潛在需求(latent demand):真正成功的功能是「把使用者已在做的事做得更容易」,觀察用戶真實工作流並將其自動化或優化。
  • Scaffolding 與等待之間的抉擇:可用外部結構(scaffolding)短期提升效能,但模型迅速升級可能讓這些補強變得多餘。評估投入報酬並決定是先造橋還是等模型自行跨越。

Claude.MD 與 prompt 簡潔性:團隊實務上採用短而精的 Claude.MD(類似個人/團隊指令集),只放最必要的規則與流程;當內容膨脹到上千 tokens,建議刪掉重寫以回到最小必要指示。目標是讓模型「最少提示即可回到正軌」。

Plan mode、sub-agents 與團隊工作法:Plan mode 是在執行前要求模型先寫計畫再動手的模式(實際上只是往 prompt 補一句「請先不要寫程式」),對於現階段仍然很有用。但模型越強,Plan mode 的需求會下降(Boris 預期可能在短期顯著縮減)。系統可自動產生並分配 sub-agents(遞迴 agent)以平行搜尋或偵錯,並在團隊 / tasks 間協作,形成「agent swarm」來產出功能或插件。

使用者互動與細節可見性:關於終端輸出冗長與否,團隊透過使用者回饋(有些人要看原始 bash / log)加上可調的 verbose 模式來兼顧新手與進階使用者。迭代頻繁、緊密回饋是設計流程的常態。

招聘與團隊文化:偏好具「初學者心態」、「從第一原理思考」並能承認錯誤的人。面試時會問「你曾錯在哪裡?」之類問題以評估學習型態。團隊同時需要超級專家(specialists)與通才(generalists),以及能夠把 agent 用到開發流程中的工程師。

生產力與實際成效:內部數據顯示自採用 Claude Code 後,Anthropic 的人均生產力顯著上升(範例指標:PR / commit 增長),某些團隊已到 70–100% 的程式碼由 agent 產出。個人層面上,Boris 自 Opus 4.5 起宣稱幾乎不再直接手寫程式碼,而是用 agent 產出並審核。

快速重寫與短生命週期:整個產品與程式碼持續被重寫、移除或替換以適應模型更新。Boris 強調沒有哪一部分會穩定超過數月──架構與 scaffolding 持續演化。

未來展望與安全性:Boris 視編碼工作將被普遍「解決」為下界:更多人可成為 builders,工程師職稱與工作內容會變得更廣泛(例如需求寫 spec、與使用者互動、系統設計等)。上界風險則包含 ASL4(模型能自我遞歸提升)或被惡用於生物/漏洞設計等場景,因此公司把 AI 安全放在核心使命。

給創業者與 DevTool 建議(總結式要點):

  • 以「潛在需求」為主:先觀察人們現在怎麼做,再把那件事做得更簡單。
  • 為下個模型而建:預期模型會在數月內大幅進步,設計時考慮這個速度。
  • 不要與模型賭鬥:更通用的模型會勝過專門的手工解法,投資需有時間成本、技術債與可替代性的考量。
  • 快速原型與頻繁 dogfooding:用小範圍、快速迭代測試使用方式與 UX。

整體而言,訪談傳達的核心是:在 LLM 快速演進的時代,成功的產品設計靠的是對使用者真實行為的觀察、以最小化的指示把模型帶上軌道、以及在「等待模型變強」與「構建 scaffolding」之間找到最佳投入。Claude Code 的經驗證明:簡潔、以使用者為中心、並且預期模型能力逐步取代手工流程,是當前最有效的策略。



沒有留言:

張貼留言