Codex、Claude Code、Antigravity——三個 AI 寫 code agent 的真實比較與選法(含預算分檔建議)
如果你最近想開始用 AI 寫 code agent,會發現選擇變多了——OpenAI 的 Codex、Anthropic 的 Claude Code、Google 在 5/19 剛大改版的 Antigravity 2.0。每家都說自己最強,每個訂閱都 $20–$200 起跳。
你不是要選最強的那一個,你是要選最划算的那一個。這篇我會用 2026/5/23 為時間錨點,講清楚:3 個工具各自的甜蜜區、不同預算下該怎麼買、為什麼 GitHub Copilot 我這篇不深講、以及一個業界已成共識的「分工搭配」做法。讓我們開始吧。

1. 為什麼這篇只比 3 個、把 GitHub Copilot 拿掉?
兩個原因:
1. GitHub Copilot 不是同一條賽道——它本質是 IDE 內的 AI 助手(補全、Inline Chat、Agent Mode),跟「你給任務、它自己做完」的 agent 工具是不同範疇。我之前寫的五工具比較裡有提到,這篇只談 agent。
2. 學生免費福利已經停發新申請——GitHub 在 4/20/2026 暫停了 Copilot Pro / Pro+ / Student 的新申請。已驗證的學生繼續免費沒問題;但新用戶現在加入只能拿 Free tier——學生天堂這條已經不適用了。
如果你的情境是:「我已經是 Copilot Pro 用戶、想繼續用」——你的選擇不在這篇討論範圍。如果是「我想開始選一個寫 code agent」——這篇就是給你的。
2. 三工具一張表 spoiler
把後面要展開的東西先壓在一張表上:
| 工具 | 模型(2026/5) | 入門價 | 額度體感 | 甜蜜區 |
|---|---|---|---|---|
| Codex | GPT-5.5 | $20/月(Plus 內建) | 不太會撞上限 | 通用任務、自動化、生圖、寫網頁、iOS App |
| Claude Code | Opus 4.7 | $20/月(Pro) | 重度用戶會撞牆 | 創意寫作、複雜邏輯、大型架構、無 AI 味 |
| Antigravity 2.0 | Gemini 3 Pro(也支援 Claude Sonnet 4.5 / GPT-OSS) | 公開 preview 個人免費 | 還沒成熟、額度寬鬆 | 美術切板、前端視覺、UI 設計 |
第一眼結論:Antigravity 個人免費可以裝來試試,但真正花錢買的兩個是 Codex 跟 Claude Code。下面三節各自展開。
3. Codex 深講
Codex 是我目前最推薦給「$20 預算內要寫 code」的人選。
為什麼? 主要兩條:
1. 額度大、不太撞上限
實測上,同樣 $20 訂閱,Codex 的可用額度大約是 Claude Code 的 10 倍。我自己跑長任務(refactor、整批生成、跑測試),Codex Plus 一個下午連續寫兩小時沒撞牆;同樣的任務 Claude Code Pro 大概 20 分鐘就跳「configuration limit reached」斷掉。
研究面也印證:同一個 benchmark 任務,Claude Code 比 Codex 多用 4 倍 token。換算 $20 訂閱的可用時數,差距就到 ~10 倍。
2. 通用任務、自動化、生圖一站搞定
Codex 包在 ChatGPT Plus 裡(你大概已經付了),桌面 App 內建外掛生態、自動化排程、Computer Use(操控你的 Mac/瀏覽器/iOS 模擬器),還有最被低估的——image_gen 工具,能直接畫架構圖、配圖、出視覺素材。
寫 iPhone App、寫網頁、做工具、跑爬蟲、整理檔案、自動化日常——Codex 處理這些「通用 + 跨工具」任務很順。
它的弱點:寫文有 AI 感。如果你叫它寫部落格、寫文案、寫客戶 Email,產出會帶一種「工整到不像人」的味道。
4. Claude Code 深講
如果 Codex 是「廣度王」,Claude Code 是「深度王」。
它擅長什麼?
1. 創意寫作、文字工作
Claude Code 不只是寫 code 工具——它是個能寫深、寫長、無 AI 味的 AI 同事。給它一份風格指南,它能持續按那個風格產出;給它一份 brief,它寫的提案比 Codex 像人 5 倍。
2. 複雜邏輯與大型架構
寫長程式碼、跨檔重構、追大型 codebase 的呼叫鏈、做 framework 設計——Claude Code 的指令遵從跟邏輯一致性贏 Codex 一截。研究面也對齊:Opus 4.7 在 SWE-bench Pro(大型架構推理)拿 64.3%,SWE-bench Verified 拿 87.6%,這兩項是業界當前頂尖。
3. 70 到 80 分的精修
如果你只想要 0 到 70 分的成品,Codex 跟 Claude Code 大致打平。但要把成品從 70 拉到 80——Claude Code 會做得明顯更好。它願意質疑你的假設、給你「這條會在 X 邊界出 bug」這種主動提醒、修改時不會把舊行為改壞。
它的弱點:額度小、撞上限快、$20 重度用戶會掙扎。一個對抗動作:Anthropic 在 5/13/2026 宣布給 Pro / Max / Team / Enterprise 用戶的週限制增加 50%,到 7/13/2026 為止。短期內好一點,但長期還是會撞。
5. Google Antigravity 2.0 深講
Antigravity 是 3 個裡最年輕的。Google 在 5/19/2026 的 I/O 上把它從原本的 IDE 大改版成 standalone desktop App + CLI + SDK + Managed Agents in Gemini API。
介面跟 Codex / Claude Code 很像——一個 AI 對話框,你跟它聊天、它幫你做完。看起來很美好。但實際用下來,它的優劣勢跟背後的 Gemini 模型強相關。
它強在哪:美術切板、前端視覺
如果你今天要處理:
- 切板、Hero banner 視覺微調
- 前端設計、UI 排版
- 概念視覺 mockup
- 簡單動畫
- Tailwind / CSS 細調
Antigravity 的表現會比 Claude Code 好,而且美感確實比較出色。Gemini 對「視覺美學」的判斷在主流模型裡偏強——它生出來的 UI 看起來「像有設計師動過」,不是 Bootstrap 預設那種感覺。
它弱在哪:複雜程式邏輯、大型任務容易翻車
但只要任務變複雜——Gemini 老問題就出來:
- 多步驟複雜邏輯:容易在第 3 步迷路、生出奇怪的 code path
- 跨檔重構:常常改 A 檔忘了 B 檔的呼叫點
- 大型 codebase:context 一拉長、品質明顯掉
- Edge case 處理:偵測不到、會直接漏
實測上,同樣的中大型任務,Antigravity 翻車機率明顯高於 Claude Code 跟 Codex。它不是不能寫 code,是「會寫但不夠穩」——你要把 review 強度拉到 1.5 倍才能用。
但有一點很值得:個人公開 preview 免費
寫到這你可能問「那為什麼還要提它?」——因為它現在個人版完全免費(公開 preview 階段)。對「想試試 AI 寫 code 但完全不想付錢」的人,Antigravity 是 2026/5 最划算的入口。
我的判斷:值得裝著觀察、別當主力
如果你問我會不會把它換掉 Codex / Claude Code——不會。但我會:
- 裝著當切板工具:要做 UI mockup、前端 hero、視覺調整的時候用它
- 觀察它的進化速度:Google 對 Antigravity 投入很重,下一個版本可能就會把邏輯問題補上
- 免費所以零成本試:不會排擠主力工具的預算
6. 依預算分檔的推薦
回到實際決策。你有多少預算決定你買哪個怎麼搭:
預算 $0:先試試免費的兩個
兩個選擇:
- Codex 免費版(ChatGPT 免費帳號就能用)——夠你跑小任務、感受 Codex 是什麼
- Antigravity 公開 preview(個人完全免費)——可以拿來試 UI / 前端任務
兩個都試、選你感覺順手的那個當入門。
預算 $20–100:無腦推 Codex
這個區間我的答案很乾脆:$20 訂 ChatGPT Plus,拿到 Codex。
理由:
- 額度大、不撞牆(vs Claude Code Pro 20 分鐘就死)
- 通用任務最廣(寫 code、自動化、生圖、Computer Use)
- Plus 還順便給你 GPT-image-2、GPT-5.5 在 ChatGPT 介面內全用
如果你只能買一個,買 Codex。
預算 $100–200:Claude Code + Codex 各訂一個
這個區間是「最好的搭配」。
- $100 Claude Max 5x——專門跑你需要 70-80 分精修的任務、寫複雜邏輯、寫文字
- $100 Codex Pro 或 $20 ChatGPT Plus——通用任務、生圖、自動化、跑大量並行 task
兩個各做最擅長的事。實測這個搭配的生產力,不是 1+1=2,是 1+1=3——因為你不用再為了「省額度」逼一個 AI 做它不擅長的事,浪費的時間遠遠超過多付的 $80。
預算更高:升一檔 Max 20x / Pro $200
如果你重度跑大型專案、整天都在派任務出去——Claude Max 20x ($200) 跟 Codex Pro 高階給你的是「幾乎不會撞牆」的安全感。但這個區間邊際效益遞減——再往上多付錢買到的只是「更多執行時數」、不是「更強的能力」。
7. 三工具的真實搭配:Driver / Worker 模式
業界這兩個月慢慢形成一個共識——Claude Code 當 Driver、Codex 當 Worker:
- Claude Code(Opus 4.7)駕車:規劃任務、拆步驟、決定怎麼做、寫核心邏輯
- Codex(GPT-5.5)執行:跑長任務、跑測試、批次處理、生圖、自動化
為什麼這樣分?
| 屬性 | Claude Code | Codex |
|---|---|---|
| 規劃能力 | 強(架構推理、邊界判斷) | 中(執行精準、規劃較弱) |
| 執行效率 | 中(token 用很兇) | 強(token 效率 +72%) |
| 創意輸出 | 強(無 AI 味) | 中(工整有 AI 感) |
| 生圖 / 視覺 | 沒有 | 有 image_gen |
Antigravity 在這個搭配的位置? 切板工人——當你需要 UI 視覺微調時叫它出來。
舉個我自己的工作流:
- 想做一個新工具 → Claude Code 跟我討論架構、拆功能、寫核心
- 確認方向後 → 把長任務(生 100 個測試、整批 refactor)派給 Codex 跑
- 要做 UI 切板、Hero banner 視覺 → Antigravity 出手
- 要配圖(README 配圖、架構圖、行銷素材)→ 回到 Codex 用 image_gen
3 個工具各做最擅長的事,串起來 > 任一個獨自硬撐。

8. 模型一定要挑對(2026/5/23 版本)
這節是時效性最強的一節。寫到這個日期為止,每個工具最強的模型是:
| 工具 | 一定要用的模型 |
|---|---|
| Codex | GPT-5.5(4/23/2026 上) |
| Claude Code | Opus 4.7(4/16/2026 上) |
| Antigravity | Gemini 3 Pro(Antigravity 預設) |
為什麼這條很重要?
很多人付了 $20 Pro 訂閱,但在介面上沒切到最頂模型,預設跑的是輕量版(為了省 token)。你以為 Codex 寫得不好——其實是它根本沒用 GPT-5.5,跑的是 GPT-5.4-mini。這就像買了跑車卻沒掛上 turbo——你體驗的不是它真正的實力。
打開設定、把模型切到上述清單,再試一次同樣的任務,你會發現差距很大。
注意:這份清單只在 2026/5/23 有效。AI 模型迭代快、再過兩三個月可能就有新版本。回到這篇的時候,先去官方頁查當前最強模型再用。

9. 我會建議你週末做的一件事
不要把這篇收藏完就關掉。今天就花 10 分鐘做這 3 件事:
1. 打開你目前主用的 AI 寫 code 工具,把模型切到旗艦版
Codex → 確認跑 GPT-5.5;Claude Code → 確認跑 Opus 4.7;Antigravity → 確認跑 Gemini 3 Pro。再跑一個你昨天做過的任務、看差距。
2. 註冊 Antigravity 公開 preview
個人免費、零成本試。專門拿一個前端 UI 任務跑——你會看到它在視覺美感上的差距。
3. 想一下你工作流裡哪些任務該換工具
如果你都用 Claude Code 在跑——有沒有「批次處理 + 自動化」任務該丟給 Codex?
如果你都用 Codex 在跑——有沒有「複雜邏輯 + 風格寫作」任務該丟給 Claude Code?
最大的浪費不是付太少訂閱費——是用錯工具做事。一個任務派錯人,效率損失遠超過你省下的 $80 訂閱費。
常見問題
Q:Cursor / Windsurf 怎麼沒比?
A:Cursor、Windsurf 是 IDE(編輯器),不是 agent。你可以把 Codex 或 Claude Code 裝進 Cursor 裡跑——它們是疊加關係不是替代。這篇談 agent 用哪個、不談編輯器選哪個。
Q:我是已驗證的 GitHub Copilot Student,繼續用還是換?
A:繼續免費用——它在 IDE 內補全跟 Inline Chat 仍然頂。但真要做產出(寫整個 feature、跑長任務、配自動化),你還是會需要 Codex 或 Claude Code。可以兩種並用:Copilot Student 跑日常補全、Codex/Claude Code 跑 agent 任務。
Q:Codex 額度真的 10x Claude Code?不是誇大嗎?
A:實測差距大致這個量級。原因是 Claude Code 同 task 用約 4 倍 token + Anthropic 對 $20 Pro 的週上限本來就保守。實際感受:跑長 refactor 或大量自動化時,Codex Plus 能連續工作兩小時、Claude Code Pro 大約 20 分鐘斷掉。如果你重度跑長任務、$20 預算選 Codex。
Q:Antigravity 既然免費,會不會以後就改收費?
A:很可能會。Google 同期推出了 AI Ultra $100/月(5x Antigravity 配額)和最高 $200/月(20x)方案——這已經是它的商業化路徑。個人 preview 免費階段是引流、不會永遠存在。免費期間就裝來試,等收費期上來再決定要不要付。
Q:如果我寫的東西很多 UI,全部用 Antigravity 行不行?
A:不推薦。UI 任務 Antigravity 強,但任何任務一旦複雜化(多步驟、跨檔、條件邏輯)就會翻車。穩定的做法是:架構 + 邏輯交給 Claude Code、UI 細節調整交給 Antigravity、批次跑跟生圖交給 Codex。
Q:模型過幾個月會換,我學的東西會不會白學?
A:模型版本會換,但「派對工具給對任務」的判斷力不會被淘汰——它隨工具變多越值錢。GPT-5.5、Opus 4.7、Gemini 3 Pro 半年內可能就有新版本,但「Codex 適合通用、Claude Code 適合精修、Antigravity 適合視覺」這套判斷邏輯會一直有用。
Q:我要把這 3 個都裝、會不會搞得很亂?
A:不會。Codex 桌面 App、Claude Code(CLI 或桌面 App)、Antigravity 桌面 App 三個各佔一個視窗,互不衝突。你只要記得「哪個任務派誰」就行——這個判斷我上面講過了。
延伸資源
- Codex 官網
- Claude Code 官方文件
- Google Antigravity
- 前篇延伸閱讀:
- 五個 AI 工具完整比較——廣度版(ChatGPT / Claude / Gemini / Microsoft Copilot / Manus)
- Claude 寫文 + Codex 配圖工作流——AI 分工另一個案例
- OpenAI Codex 完整入門——Codex 沒玩過的先讀這個