Codex 一人公司工作術

Codex、Claude Code、Antigravity——三個 AI 寫 code agent 的真實比較與選法（含預算分檔建議）

Ray 貓

23 May 2026 • 14 min read

如果你最近想開始用 AI 寫 code agent，會發現選擇變多了——OpenAI 的 Codex、Anthropic 的 Claude Code、Google 在 5/19 剛大改版的 Antigravity 2.0。每家都說自己最強，每個訂閱都 $20–$200 起跳。

你不是要選最強的那一個，你是要選最划算的那一個。這篇我會用 2026/5/23 為時間錨點，講清楚：3 個工具各自的甜蜜區、不同預算下該怎麼買、為什麼 GitHub Copilot 我這篇不深講、以及一個業界已成共識的「分工搭配」做法。讓我們開始吧。

Codex、Claude Code、Antigravity——你的預算該買哪個？

1. 為什麼這篇只比 3 個、把 GitHub Copilot 拿掉？

兩個原因：

1. GitHub Copilot 不是同一條賽道——它本質是 IDE 內的 AI 助手（補全、Inline Chat、Agent Mode），跟「你給任務、它自己做完」的 agent 工具是不同範疇。我之前寫的五工具比較裡有提到，這篇只談 agent。

2. 學生免費福利已經停發新申請——GitHub 在 4/20/2026 暫停了 Copilot Pro / Pro+ / Student 的新申請。已驗證的學生繼續免費沒問題；但新用戶現在加入只能拿 Free tier——學生天堂這條已經不適用了。

如果你的情境是：「我已經是 Copilot Pro 用戶、想繼續用」——你的選擇不在這篇討論範圍。如果是「我想開始選一個寫 code agent」——這篇就是給你的。

2. 三工具一張表 spoiler

把後面要展開的東西先壓在一張表上：

工具	模型（2026/5）	入門價	額度體感	甜蜜區
Codex	GPT-5.5	$20/月（Plus 內建）	不太會撞上限	通用任務、自動化、生圖、寫網頁、iOS App
Claude Code	Opus 4.7	$20/月（Pro）	重度用戶會撞牆	創意寫作、複雜邏輯、大型架構、無 AI 味
Antigravity 2.0	Gemini 3 Pro（也支援 Claude Sonnet 4.5 / GPT-OSS）	公開 preview 個人免費	還沒成熟、額度寬鬆	美術切板、前端視覺、UI 設計

第一眼結論：Antigravity 個人免費可以裝來試試，但真正花錢買的兩個是 Codex 跟 Claude Code。下面三節各自展開。

3. Codex 深講

Codex 是我目前最推薦給「$20 預算內要寫 code」的人選。

為什麼？ 主要兩條：

1. 額度大、不太撞上限

實測上，同樣 $20 訂閱，Codex 的可用額度大約是 Claude Code 的 10 倍。我自己跑長任務（refactor、整批生成、跑測試），Codex Plus 一個下午連續寫兩小時沒撞牆；同樣的任務 Claude Code Pro 大概 20 分鐘就跳「configuration limit reached」斷掉。

研究面也印證：同一個 benchmark 任務，Claude Code 比 Codex 多用 4 倍 token。換算 $20 訂閱的可用時數，差距就到 ~10 倍。

2. 通用任務、自動化、生圖一站搞定

Codex 包在 ChatGPT Plus 裡（你大概已經付了），桌面 App 內建外掛生態、自動化排程、Computer Use（操控你的 Mac/瀏覽器/iOS 模擬器），還有最被低估的——image_gen 工具，能直接畫架構圖、配圖、出視覺素材。

寫 iPhone App、寫網頁、做工具、跑爬蟲、整理檔案、自動化日常——Codex 處理這些「通用 + 跨工具」任務很順。

它的弱點：寫文有 AI 感。如果你叫它寫部落格、寫文案、寫客戶 Email，產出會帶一種「工整到不像人」的味道。

4. Claude Code 深講

如果 Codex 是「廣度王」，Claude Code 是「深度王」。

它擅長什麼？

1. 創意寫作、文字工作

Claude Code 不只是寫 code 工具——它是個能寫深、寫長、無 AI 味的 AI 同事。給它一份風格指南，它能持續按那個風格產出；給它一份 brief，它寫的提案比 Codex 像人 5 倍。

2. 複雜邏輯與大型架構

寫長程式碼、跨檔重構、追大型 codebase 的呼叫鏈、做 framework 設計——Claude Code 的指令遵從跟邏輯一致性贏 Codex 一截。研究面也對齊：Opus 4.7 在 SWE-bench Pro（大型架構推理）拿 64.3%，SWE-bench Verified 拿 87.6%，這兩項是業界當前頂尖。

3. 70 到 80 分的精修

如果你只想要 0 到 70 分的成品，Codex 跟 Claude Code 大致打平。但要把成品從 70 拉到 80——Claude Code 會做得明顯更好。它願意質疑你的假設、給你「這條會在 X 邊界出 bug」這種主動提醒、修改時不會把舊行為改壞。

它的弱點：額度小、撞上限快、$20 重度用戶會掙扎。一個對抗動作：Anthropic 在 5/13/2026 宣布給 Pro / Max / Team / Enterprise 用戶的週限制增加 50%，到 7/13/2026 為止。短期內好一點，但長期還是會撞。

5. Google Antigravity 2.0 深講

Antigravity 是 3 個裡最年輕的。Google 在 5/19/2026 的 I/O 上把它從原本的 IDE 大改版成 standalone desktop App + CLI + SDK + Managed Agents in Gemini API。

介面跟 Codex / Claude Code 很像——一個 AI 對話框，你跟它聊天、它幫你做完。看起來很美好。但實際用下來，它的優劣勢跟背後的 Gemini 模型強相關。

它強在哪：美術切板、前端視覺

如果你今天要處理：

切板、Hero banner 視覺微調
前端設計、UI 排版
概念視覺 mockup
簡單動畫
Tailwind / CSS 細調

Antigravity 的表現會比 Claude Code 好，而且美感確實比較出色。Gemini 對「視覺美學」的判斷在主流模型裡偏強——它生出來的 UI 看起來「像有設計師動過」，不是 Bootstrap 預設那種感覺。

它弱在哪：複雜程式邏輯、大型任務容易翻車

但只要任務變複雜——Gemini 老問題就出來：

多步驟複雜邏輯：容易在第 3 步迷路、生出奇怪的 code path
跨檔重構：常常改 A 檔忘了 B 檔的呼叫點
大型 codebase：context 一拉長、品質明顯掉
Edge case 處理：偵測不到、會直接漏

實測上，同樣的中大型任務，Antigravity 翻車機率明顯高於 Claude Code 跟 Codex。它不是不能寫 code，是「會寫但不夠穩」——你要把 review 強度拉到 1.5 倍才能用。

但有一點很值得：個人公開 preview 免費

寫到這你可能問「那為什麼還要提它？」——因為它現在個人版完全免費（公開 preview 階段）。對「想試試 AI 寫 code 但完全不想付錢」的人，Antigravity 是 2026/5 最划算的入口。

我的判斷：值得裝著觀察、別當主力

如果你問我會不會把它換掉 Codex / Claude Code——不會。但我會：

裝著當切板工具：要做 UI mockup、前端 hero、視覺調整的時候用它
觀察它的進化速度：Google 對 Antigravity 投入很重，下一個版本可能就會把邏輯問題補上
免費所以零成本試：不會排擠主力工具的預算

6. 依預算分檔的推薦

回到實際決策。你有多少預算決定你買哪個怎麼搭：

預算 $0：先試試免費的兩個

兩個選擇：

Codex 免費版（ChatGPT 免費帳號就能用）——夠你跑小任務、感受 Codex 是什麼
Antigravity 公開 preview（個人完全免費）——可以拿來試 UI / 前端任務

兩個都試、選你感覺順手的那個當入門。

預算 $20–100：無腦推 Codex

這個區間我的答案很乾脆：$20 訂 ChatGPT Plus，拿到 Codex。

理由：

額度大、不撞牆（vs Claude Code Pro 20 分鐘就死）
通用任務最廣（寫 code、自動化、生圖、Computer Use）
Plus 還順便給你 GPT-image-2、GPT-5.5 在 ChatGPT 介面內全用

如果你只能買一個，買 Codex。

預算 $100–200：Claude Code + Codex 各訂一個

這個區間是「最好的搭配」。

$100 Claude Max 5x——專門跑你需要 70-80 分精修的任務、寫複雜邏輯、寫文字
$100 Codex Pro 或 $20 ChatGPT Plus——通用任務、生圖、自動化、跑大量並行 task

兩個各做最擅長的事。實測這個搭配的生產力，不是 1+1=2，是 1+1=3——因為你不用再為了「省額度」逼一個 AI 做它不擅長的事，浪費的時間遠遠超過多付的 $80。

預算更高：升一檔 Max 20x / Pro $200

如果你重度跑大型專案、整天都在派任務出去——Claude Max 20x ($200) 跟 Codex Pro 高階給你的是「幾乎不會撞牆」的安全感。但這個區間邊際效益遞減——再往上多付錢買到的只是「更多執行時數」、不是「更強的能力」。

7. 三工具的真實搭配：Driver / Worker 模式

業界這兩個月慢慢形成一個共識——Claude Code 當 Driver、Codex 當 Worker：

Claude Code（Opus 4.7）駕車：規劃任務、拆步驟、決定怎麼做、寫核心邏輯
Codex（GPT-5.5）執行：跑長任務、跑測試、批次處理、生圖、自動化

為什麼這樣分？

屬性	Claude Code	Codex
規劃能力	強（架構推理、邊界判斷）	中（執行精準、規劃較弱）
執行效率	中（token 用很兇）	強（token 效率 +72%）
創意輸出	強（無 AI 味）	中（工整有 AI 感）
生圖 / 視覺	沒有	有 image_gen

Antigravity 在這個搭配的位置？ 切板工人——當你需要 UI 視覺微調時叫它出來。

舉個我自己的工作流：

想做一個新工具 → Claude Code 跟我討論架構、拆功能、寫核心
確認方向後 → 把長任務（生 100 個測試、整批 refactor）派給 Codex 跑
要做 UI 切板、Hero banner 視覺 → Antigravity 出手
要配圖（README 配圖、架構圖、行銷素材）→ 回到 Codex 用 image_gen

3 個工具各做最擅長的事，串起來 > 任一個獨自硬撐。

Driver / Worker / Craftsman——Claude Code 駕、Codex 執行、Antigravity 切板

8. 模型一定要挑對（2026/5/23 版本）

這節是時效性最強的一節。寫到這個日期為止，每個工具最強的模型是：

工具	一定要用的模型
Codex	GPT-5.5（4/23/2026 上）
Claude Code	Opus 4.7（4/16/2026 上）
Antigravity	Gemini 3 Pro（Antigravity 預設）

為什麼這條很重要？

很多人付了 $20 Pro 訂閱，但在介面上沒切到最頂模型，預設跑的是輕量版（為了省 token）。你以為 Codex 寫得不好——其實是它根本沒用 GPT-5.5，跑的是 GPT-5.4-mini。這就像買了跑車卻沒掛上 turbo——你體驗的不是它真正的實力。

打開設定、把模型切到上述清單，再試一次同樣的任務，你會發現差距很大。

注意：這份清單只在 2026/5/23 有效。AI 模型迭代快、再過兩三個月可能就有新版本。回到這篇的時候，先去官方頁查當前最強模型再用。

模型一定要挑對：沒掛 turbo 的跑車 vs 真正實力

9. 我會建議你週末做的一件事

不要把這篇收藏完就關掉。今天就花 10 分鐘做這 3 件事：

1. 打開你目前主用的 AI 寫 code 工具，把模型切到旗艦版

Codex → 確認跑 GPT-5.5；Claude Code → 確認跑 Opus 4.7；Antigravity → 確認跑 Gemini 3 Pro。再跑一個你昨天做過的任務、看差距。

2. 註冊 Antigravity 公開 preview

個人免費、零成本試。專門拿一個前端 UI 任務跑——你會看到它在視覺美感上的差距。

3. 想一下你工作流裡哪些任務該換工具

如果你都用 Claude Code 在跑——有沒有「批次處理 + 自動化」任務該丟給 Codex？
如果你都用 Codex 在跑——有沒有「複雜邏輯 + 風格寫作」任務該丟給 Claude Code？

最大的浪費不是付太少訂閱費——是用錯工具做事。一個任務派錯人，效率損失遠超過你省下的 $80 訂閱費。

常見問題

Q：Cursor / Windsurf 怎麼沒比？

A：Cursor、Windsurf 是 IDE（編輯器），不是 agent。你可以把 Codex 或 Claude Code 裝進 Cursor 裡跑——它們是疊加關係不是替代。這篇談 agent 用哪個、不談編輯器選哪個。

Q：我是已驗證的 GitHub Copilot Student，繼續用還是換？

A：繼續免費用——它在 IDE 內補全跟 Inline Chat 仍然頂。但真要做產出（寫整個 feature、跑長任務、配自動化），你還是會需要 Codex 或 Claude Code。可以兩種並用：Copilot Student 跑日常補全、Codex/Claude Code 跑 agent 任務。

Q：Codex 額度真的 10x Claude Code？不是誇大嗎？

A：實測差距大致這個量級。原因是 Claude Code 同 task 用約 4 倍 token + Anthropic 對 $20 Pro 的週上限本來就保守。實際感受：跑長 refactor 或大量自動化時，Codex Plus 能連續工作兩小時、Claude Code Pro 大約 20 分鐘斷掉。如果你重度跑長任務、$20 預算選 Codex。

Q：Antigravity 既然免費，會不會以後就改收費？

A：很可能會。Google 同期推出了 AI Ultra $100/月（5x Antigravity 配額）和最高 $200/月（20x）方案——這已經是它的商業化路徑。個人 preview 免費階段是引流、不會永遠存在。免費期間就裝來試，等收費期上來再決定要不要付。

Q：如果我寫的東西很多 UI，全部用 Antigravity 行不行？

A：不推薦。UI 任務 Antigravity 強，但任何任務一旦複雜化（多步驟、跨檔、條件邏輯）就會翻車。穩定的做法是：架構 + 邏輯交給 Claude Code、UI 細節調整交給 Antigravity、批次跑跟生圖交給 Codex。

Q：模型過幾個月會換，我學的東西會不會白學？

A：模型版本會換，但「派對工具給對任務」的判斷力不會被淘汰——它隨工具變多越值錢。GPT-5.5、Opus 4.7、Gemini 3 Pro 半年內可能就有新版本，但「Codex 適合通用、Claude Code 適合精修、Antigravity 適合視覺」這套判斷邏輯會一直有用。

Q：我要把這 3 個都裝、會不會搞得很亂？

A：不會。Codex 桌面 App、Claude Code（CLI 或桌面 App）、Antigravity 桌面 App 三個各佔一個視窗，互不衝突。你只要記得「哪個任務派誰」就行——這個判斷我上面講過了。

延伸資源

Codex 官網
Claude Code 官方文件
Google Antigravity
前篇延伸閱讀：
- 五個 AI 工具完整比較——廣度版（ChatGPT / Claude / Gemini / Microsoft Copilot / Manus）
- Claude 寫文 + Codex 配圖工作流——AI 分工另一個案例
- OpenAI Codex 完整入門——Codex 沒玩過的先讀這個