Codex、Claude Code、Antigravity——三個 AI 寫 code agent 的真實比較與選法(含預算分檔建議)

Codex、Claude Code、Antigravity——三個 AI 寫 code agent 的真實比較與選法(含預算分檔建議)

如果你最近想開始用 AI 寫 code agent,會發現選擇變多了——OpenAI 的 Codex、Anthropic 的 Claude Code、Google 在 5/19 剛大改版的 Antigravity 2.0。每家都說自己最強,每個訂閱都 $20–$200 起跳。

你不是要選最強的那一個,你是要選最划算的那一個。這篇我會用 2026/5/23 為時間錨點,講清楚:3 個工具各自的甜蜜區、不同預算下該怎麼買、為什麼 GitHub Copilot 我這篇不深講、以及一個業界已成共識的「分工搭配」做法。讓我們開始吧。

Codex、Claude Code、Antigravity——你的預算該買哪個?


1. 為什麼這篇只比 3 個、把 GitHub Copilot 拿掉?

兩個原因:

1. GitHub Copilot 不是同一條賽道——它本質是 IDE 內的 AI 助手(補全、Inline Chat、Agent Mode),跟「你給任務、它自己做完」的 agent 工具是不同範疇。我之前寫的五工具比較裡有提到,這篇只談 agent。

2. 學生免費福利已經停發新申請——GitHub 在 4/20/2026 暫停了 Copilot Pro / Pro+ / Student 的新申請。已驗證的學生繼續免費沒問題;但新用戶現在加入只能拿 Free tier——學生天堂這條已經不適用了。

如果你的情境是:「我已經是 Copilot Pro 用戶、想繼續用」——你的選擇不在這篇討論範圍。如果是「我想開始選一個寫 code agent」——這篇就是給你的。


2. 三工具一張表 spoiler

把後面要展開的東西先壓在一張表上:

工具 模型(2026/5) 入門價 額度體感 甜蜜區
Codex GPT-5.5 $20/月(Plus 內建) 不太會撞上限 通用任務、自動化、生圖、寫網頁、iOS App
Claude Code Opus 4.7 $20/月(Pro) 重度用戶會撞牆 創意寫作、複雜邏輯、大型架構、無 AI 味
Antigravity 2.0 Gemini 3 Pro(也支援 Claude Sonnet 4.5 / GPT-OSS) 公開 preview 個人免費 還沒成熟、額度寬鬆 美術切板、前端視覺、UI 設計

第一眼結論:Antigravity 個人免費可以裝來試試,但真正花錢買的兩個是 Codex 跟 Claude Code。下面三節各自展開。


3. Codex 深講

Codex 是我目前最推薦給「$20 預算內要寫 code」的人選。

為什麼? 主要兩條:

1. 額度大、不太撞上限

實測上,同樣 $20 訂閱,Codex 的可用額度大約是 Claude Code 的 10 倍。我自己跑長任務(refactor、整批生成、跑測試),Codex Plus 一個下午連續寫兩小時沒撞牆;同樣的任務 Claude Code Pro 大概 20 分鐘就跳「configuration limit reached」斷掉。

研究面也印證:同一個 benchmark 任務,Claude Code 比 Codex 多用 4 倍 token。換算 $20 訂閱的可用時數,差距就到 ~10 倍。

2. 通用任務、自動化、生圖一站搞定

Codex 包在 ChatGPT Plus 裡(你大概已經付了),桌面 App 內建外掛生態、自動化排程、Computer Use(操控你的 Mac/瀏覽器/iOS 模擬器),還有最被低估的——image_gen 工具,能直接畫架構圖、配圖、出視覺素材。

寫 iPhone App、寫網頁、做工具、跑爬蟲、整理檔案、自動化日常——Codex 處理這些「通用 + 跨工具」任務很順。

它的弱點:寫文有 AI 感。如果你叫它寫部落格、寫文案、寫客戶 Email,產出會帶一種「工整到不像人」的味道。


4. Claude Code 深講

如果 Codex 是「廣度王」,Claude Code 是「深度王」。

它擅長什麼?

1. 創意寫作、文字工作

Claude Code 不只是寫 code 工具——它是個能寫深、寫長、無 AI 味的 AI 同事。給它一份風格指南,它能持續按那個風格產出;給它一份 brief,它寫的提案比 Codex 像人 5 倍。

2. 複雜邏輯與大型架構

寫長程式碼、跨檔重構、追大型 codebase 的呼叫鏈、做 framework 設計——Claude Code 的指令遵從跟邏輯一致性贏 Codex 一截。研究面也對齊:Opus 4.7 在 SWE-bench Pro(大型架構推理)拿 64.3%,SWE-bench Verified 拿 87.6%,這兩項是業界當前頂尖。

3. 70 到 80 分的精修

如果你只想要 0 到 70 分的成品,Codex 跟 Claude Code 大致打平。但要把成品從 70 拉到 80——Claude Code 會做得明顯更好。它願意質疑你的假設、給你「這條會在 X 邊界出 bug」這種主動提醒、修改時不會把舊行為改壞。

它的弱點:額度小、撞上限快、$20 重度用戶會掙扎。一個對抗動作:Anthropic 在 5/13/2026 宣布給 Pro / Max / Team / Enterprise 用戶的週限制增加 50%,到 7/13/2026 為止。短期內好一點,但長期還是會撞。


5. Google Antigravity 2.0 深講

Antigravity 是 3 個裡最年輕的。Google 在 5/19/2026 的 I/O 上把它從原本的 IDE 大改版成 standalone desktop App + CLI + SDK + Managed Agents in Gemini API。

介面跟 Codex / Claude Code 很像——一個 AI 對話框,你跟它聊天、它幫你做完。看起來很美好。但實際用下來,它的優劣勢跟背後的 Gemini 模型強相關

它強在哪:美術切板、前端視覺

如果你今天要處理:

  • 切板、Hero banner 視覺微調
  • 前端設計、UI 排版
  • 概念視覺 mockup
  • 簡單動畫
  • Tailwind / CSS 細調

Antigravity 的表現會比 Claude Code 好,而且美感確實比較出色。Gemini 對「視覺美學」的判斷在主流模型裡偏強——它生出來的 UI 看起來「像有設計師動過」,不是 Bootstrap 預設那種感覺。

它弱在哪:複雜程式邏輯、大型任務容易翻車

但只要任務變複雜——Gemini 老問題就出來

  • 多步驟複雜邏輯:容易在第 3 步迷路、生出奇怪的 code path
  • 跨檔重構:常常改 A 檔忘了 B 檔的呼叫點
  • 大型 codebase:context 一拉長、品質明顯掉
  • Edge case 處理:偵測不到、會直接漏

實測上,同樣的中大型任務,Antigravity 翻車機率明顯高於 Claude Code 跟 Codex。它不是不能寫 code,是「會寫但不夠穩」——你要把 review 強度拉到 1.5 倍才能用。

但有一點很值得:個人公開 preview 免費

寫到這你可能問「那為什麼還要提它?」——因為它現在個人版完全免費(公開 preview 階段)。對「想試試 AI 寫 code 但完全不想付錢」的人,Antigravity 是 2026/5 最划算的入口。

我的判斷:值得裝著觀察、別當主力

如果你問我會不會把它換掉 Codex / Claude Code——不會。但我會:

  1. 裝著當切板工具:要做 UI mockup、前端 hero、視覺調整的時候用它
  2. 觀察它的進化速度:Google 對 Antigravity 投入很重,下一個版本可能就會把邏輯問題補上
  3. 免費所以零成本試:不會排擠主力工具的預算

6. 依預算分檔的推薦

回到實際決策。你有多少預算決定你買哪個怎麼搭

預算 $0:先試試免費的兩個

兩個選擇:

  • Codex 免費版(ChatGPT 免費帳號就能用)——夠你跑小任務、感受 Codex 是什麼
  • Antigravity 公開 preview(個人完全免費)——可以拿來試 UI / 前端任務

兩個都試、選你感覺順手的那個當入門。

預算 $20–100:無腦推 Codex

這個區間我的答案很乾脆:$20 訂 ChatGPT Plus,拿到 Codex

理由:

  1. 額度大、不撞牆(vs Claude Code Pro 20 分鐘就死)
  2. 通用任務最廣(寫 code、自動化、生圖、Computer Use)
  3. Plus 還順便給你 GPT-image-2、GPT-5.5 在 ChatGPT 介面內全用

如果你只能買一個,買 Codex。

預算 $100–200:Claude Code + Codex 各訂一個

這個區間是「最好的搭配」。

  • $100 Claude Max 5x——專門跑你需要 70-80 分精修的任務、寫複雜邏輯、寫文字
  • $100 Codex Pro$20 ChatGPT Plus——通用任務、生圖、自動化、跑大量並行 task

兩個各做最擅長的事。實測這個搭配的生產力,不是 1+1=2,是 1+1=3——因為你不用再為了「省額度」逼一個 AI 做它不擅長的事,浪費的時間遠遠超過多付的 $80。

預算更高:升一檔 Max 20x / Pro $200

如果你重度跑大型專案、整天都在派任務出去——Claude Max 20x ($200) 跟 Codex Pro 高階給你的是「幾乎不會撞牆」的安全感。但這個區間邊際效益遞減——再往上多付錢買到的只是「更多執行時數」、不是「更強的能力」。


7. 三工具的真實搭配:Driver / Worker 模式

業界這兩個月慢慢形成一個共識——Claude Code 當 Driver、Codex 當 Worker

  • Claude Code(Opus 4.7)駕車:規劃任務、拆步驟、決定怎麼做、寫核心邏輯
  • Codex(GPT-5.5)執行:跑長任務、跑測試、批次處理、生圖、自動化

為什麼這樣分?

屬性 Claude Code Codex
規劃能力 強(架構推理、邊界判斷) 中(執行精準、規劃較弱)
執行效率 中(token 用很兇) 強(token 效率 +72%)
創意輸出 強(無 AI 味) 中(工整有 AI 感)
生圖 / 視覺 沒有 image_gen

Antigravity 在這個搭配的位置? 切板工人——當你需要 UI 視覺微調時叫它出來。

舉個我自己的工作流:

  1. 想做一個新工具 → Claude Code 跟我討論架構、拆功能、寫核心
  2. 確認方向後 → 把長任務(生 100 個測試、整批 refactor)派給 Codex
  3. 要做 UI 切板、Hero banner 視覺 → Antigravity 出手
  4. 要配圖(README 配圖、架構圖、行銷素材)→ 回到 Codex 用 image_gen

3 個工具各做最擅長的事,串起來 > 任一個獨自硬撐

Driver / Worker / Craftsman——Claude Code 駕、Codex 執行、Antigravity 切板


8. 模型一定要挑對(2026/5/23 版本)

這節是時效性最強的一節。寫到這個日期為止,每個工具最強的模型是

工具 一定要用的模型
Codex GPT-5.5(4/23/2026 上)
Claude Code Opus 4.7(4/16/2026 上)
Antigravity Gemini 3 Pro(Antigravity 預設)

為什麼這條很重要?

很多人付了 $20 Pro 訂閱,但在介面上沒切到最頂模型,預設跑的是輕量版(為了省 token)。你以為 Codex 寫得不好——其實是它根本沒用 GPT-5.5,跑的是 GPT-5.4-mini。這就像買了跑車卻沒掛上 turbo——你體驗的不是它真正的實力

打開設定、把模型切到上述清單,再試一次同樣的任務,你會發現差距很大。

注意:這份清單只在 2026/5/23 有效。AI 模型迭代快、再過兩三個月可能就有新版本。回到這篇的時候,先去官方頁查當前最強模型再用

模型一定要挑對:沒掛 turbo 的跑車 vs 真正實力


9. 我會建議你週末做的一件事

不要把這篇收藏完就關掉。今天就花 10 分鐘做這 3 件事:

1. 打開你目前主用的 AI 寫 code 工具,把模型切到旗艦版

Codex → 確認跑 GPT-5.5;Claude Code → 確認跑 Opus 4.7;Antigravity → 確認跑 Gemini 3 Pro。再跑一個你昨天做過的任務、看差距。

2. 註冊 Antigravity 公開 preview

個人免費、零成本試。專門拿一個前端 UI 任務跑——你會看到它在視覺美感上的差距。

3. 想一下你工作流裡哪些任務該換工具

如果你都用 Claude Code 在跑——有沒有「批次處理 + 自動化」任務該丟給 Codex?
如果你都用 Codex 在跑——有沒有「複雜邏輯 + 風格寫作」任務該丟給 Claude Code?

最大的浪費不是付太少訂閱費——是用錯工具做事。一個任務派錯人,效率損失遠超過你省下的 $80 訂閱費。


常見問題

Q:Cursor / Windsurf 怎麼沒比?

A:Cursor、Windsurf 是 IDE(編輯器),不是 agent。你可以把 Codex 或 Claude Code 裝進 Cursor 裡跑——它們是疊加關係不是替代。這篇談 agent 用哪個、不談編輯器選哪個。

Q:我是已驗證的 GitHub Copilot Student,繼續用還是換?

A:繼續免費用——它在 IDE 內補全跟 Inline Chat 仍然頂。但真要做產出(寫整個 feature、跑長任務、配自動化),你還是會需要 Codex 或 Claude Code。可以兩種並用:Copilot Student 跑日常補全、Codex/Claude Code 跑 agent 任務。

Q:Codex 額度真的 10x Claude Code?不是誇大嗎?

A:實測差距大致這個量級。原因是 Claude Code 同 task 用約 4 倍 token + Anthropic 對 $20 Pro 的週上限本來就保守。實際感受:跑長 refactor 或大量自動化時,Codex Plus 能連續工作兩小時、Claude Code Pro 大約 20 分鐘斷掉。如果你重度跑長任務、$20 預算選 Codex。

Q:Antigravity 既然免費,會不會以後就改收費?

A:很可能會。Google 同期推出了 AI Ultra $100/月(5x Antigravity 配額)和最高 $200/月(20x)方案——這已經是它的商業化路徑。個人 preview 免費階段是引流、不會永遠存在。免費期間就裝來試,等收費期上來再決定要不要付。

Q:如果我寫的東西很多 UI,全部用 Antigravity 行不行?

A:不推薦。UI 任務 Antigravity 強,但任何任務一旦複雜化(多步驟、跨檔、條件邏輯)就會翻車。穩定的做法是:架構 + 邏輯交給 Claude Code、UI 細節調整交給 Antigravity、批次跑跟生圖交給 Codex。

Q:模型過幾個月會換,我學的東西會不會白學?

A:模型版本會換,但「派對工具給對任務」的判斷力不會被淘汰——它隨工具變多越值錢。GPT-5.5、Opus 4.7、Gemini 3 Pro 半年內可能就有新版本,但「Codex 適合通用、Claude Code 適合精修、Antigravity 適合視覺」這套判斷邏輯會一直有用

Q:我要把這 3 個都裝、會不會搞得很亂?

A:不會。Codex 桌面 App、Claude Code(CLI 或桌面 App)、Antigravity 桌面 App 三個各佔一個視窗,互不衝突。你只要記得「哪個任務派誰」就行——這個判斷我上面講過了。


延伸資源