
第一節:軟體開發者終端 (terminal) 的再想像
對於軟體開發者而言,命令列介面 (Command-Line Interface, CLI) 不僅僅是一個工具,它更像是一個「家」1。老練的開發者偶爾也會以能夠用命令列就能有效率地完成大量的工作、來 dis 那些過度依賴圖形介面(GUI)的開發者,顯示出自己不同於那些沒學好命令列、「手藝不精」的開發者。反正,就是個軟體開發者之間存在已久、若隱若現的歧視鏈。
不過,這些命令列終端的效率、普遍性與可攜性,確實是許多軟體工程師完成工作的首選。隨著開發者對終端的依賴持續不減,再隨著最近 LLM 和 Vibe Coding 等趨勢興起,大家對於整合式 AI 輔助的需求也與日俱增。於是,「代理人式 CLI」(Agentic CLI) 或稱「終端代理人」(Terminal Agent) 的概念應運而生,它代表了開發者與 AI 互動的下一個演進階段。新的互動方式不僅僅是簡單的指令執行,而是一種對話式、協作式的全新開發模式,AI 能夠代表開發者進行推理、規劃並採取行動 3。
Google 近期發表的 Gemini CLI,正是進軍這個新興戰場的重量級產品。Google 將其定位為「對命令列體驗的根本性升級」,目的是提供從提示詞(prompt)到模型最短最快的路徑 1。這次的發表呼應了整個產業趨勢,因為就在 Gemini CLI 問世前的幾個月內,Anthropic 推出了 Claude Code,OpenAI 也發表了其 Codex CLI,三大 AI 巨頭不約而同地將目光投向了開發者終端 4。
這種趨勢的背後,說穿了就是為了更進一步掌握開發者生態:開發者的終端已成為 AI 普及與生態系鎖定的關鍵戰場。開發者是高價值用戶群體,他們的工具選擇會對底層平台和雲端服務的採用產生連鎖效應。相較於較為分散的整合開發環境 (IDE),終端是一個黏著度高、使用頻繁的環境 1。一個在終端中變得不可或缺的 AI 代理人,將能直接影響開發者對底層模型、API 乃至雲端服務的選擇。而且一旦選定成為習慣,將會非常難跳轉陣營。
因此,這波終端代理人工具的發表熱潮,不僅關乎提升開發者生產力,更是一場爭奪下一代軟體開發工作流程主導權的生態戰爭。這場戰爭的核心,是爭奪開發者與其機器之間最主要的「互動介面」。
本文將深入剖析 Google Gemini CLI,從其技術架構、核心能力、實際應用與開發者反饋,到其在 Google AI 生態系中的戰略定位,並與主要競爭對手進行詳細比較,最後探討其對未來 AI 發展的深遠影響。
✦延伸閱讀:AI Agent 是什麼?與 AI 助理、Chatbot 差異比較和應用場景解析
第二節:解構 Gemini CLI:架構、能力與使用者體驗
2.1核心引擎:Gemini 2.5 Pro 與百萬 Token 上下文視窗
Google Gemini CLI 的核心驅動力是 Google 最先進的 gemini-2.5-pro 模型 1。這個模型最引人注目的特點,也是 Google 行銷的重點,是高達 100 萬 Token 的超大上下文視窗 (Context Window) 1。這項能力讓 Gemini CLI 能夠一次性分析極大量的資訊,例如龐大的程式碼庫、多份文件或冗長的對話歷史,而不會輕易遺失上下文,從而進行更複雜的推理與操作。
除了處理文字,Gemini CLI 還具備多模態 (Multimodal) 能力,能夠根據 PDF 或手繪草圖等非文字輸入來生成新的應用程式,展現了其超越純文字程式碼處理的能力 4。
在技術基礎上,Gemini CLI 使用 Node.js (要求 v18 或更高版本) 建立,並透過 npm 套件的形式發布 8。這個選擇使其能夠輕易地被廣大的 JavaScript 和網頁開發者社群所接受和使用,降低了入門門檻。
✦延伸閱讀:NotebookLM 怎麼用?6 種資料整理指令教學,與 ChatGPT、Notion AI 比較
2.2代理人的心臟:「推理與行動」循環及內建工具
Gemini CLI 的運作模式基於一個被稱為「推理與行動」(Reason and Act, ReAct) 的循環框架 3。在這個框架下,AI 代理人會首先規劃一系列行動步驟,接著使用可用的工具來執行這些步驟,然後觀察執行結果,最後根據結果進行推理,以決定下一步的行動。這正是其「代理人式」特質的核心。
為了支援這個循環,Gemini CLI 內建了一套豐富的工具,使其能夠與本地端系統和網路進行互動。這些關鍵工具包括:
- 檔案系統工具:ReadFile (讀取單一檔案)、WriteFile (寫入新檔案)、Edit (透過 diff 格式應用程式碼變更)、FindFiles (等同於 glob,用於模式比對尋找檔案) 和 ReadManyFiles (一次讀取多個檔案) 8。
- 執行工具:Shell (用於執行終端機指令,以 ! 為前綴) 和 SearchText (等同於 grep,用於在檔案內搜尋文字) 8。
- 網路工具:GoogleSearch (用即時資訊來為回應提供事實基礎) 和 WebFetch (從 URL 獲取網頁內容) 1。
- 記憶工具:Save Memory (memoryTool),用於在單次對話中儲存事實和偏好設定,以提高後續回應的一致性 8。
此外,開發者可以透過在專案根目錄中建立一個名為 GEMINI.md 的檔案,來為特定專案客製化代理人的行為。這個檔案的功能類似於一個永久性的系統提示詞 (System Prompt),讓代理人能夠依循特定的專案規則或程式碼風格進行工作 2。
✦延伸閱讀:AI coding工具Gemini Code Assist介紹,與GitHub Copilot 比較
2.3存取、認證與企業級應用的摩擦點
Google 為 Gemini CLI 制定了雙軌並行的存取策略,一方面極具吸引力,另一方面卻也引發了不小的爭議。
- 「免費增值」策略:對於個人開發者,Google 提供了極為慷慨的免費方案。使用者只需使用個人 Google 帳號登入,即可獲得免費的 Gemini Code Assist 授權,進而免費使用搭載 100 萬 Token 上下文視窗的 Gemini 2.5 Pro 模型。其使用額度高達每分鐘 60 次請求、每日 1,000 次請求,且完全免費 1。
- 進階認證:若需要更高的使用額度或指定特定模型,使用者可以透過 Google AI Studio 或 Vertex AI 產生的 API 金鑰進行認證,轉為基於用量的付費模式 1。
- Workspace 的困境:然而,一個顯著的摩擦點和社群批評的焦點,出現在擁有付費 Google Workspace 帳號的用戶身上。這些用戶往往無法享受免費方案,而是被要求設定 GOOGLE_CLOUD_PROJECT 環境變數,這實質上將他們導向了另一個需要額外付費的「Gemini for Google Cloud」訂閱方案 12。這種做法被普遍認為是在懲罰付費客戶,同時獎勵免費使用者,引發了 GWS 使用者一些不滿。
這種慷慨的免費策略是一把雙面刃。這無疑是一種快速獲取用戶的強大手段,目的就是迅速建立龐大的用戶基礎,並收集海量的真實世界使用數據,以挑戰競爭對手。然而,這一策略似乎也給 Google 的基礎設施帶來了巨大壓力,導致了與其行銷承諾相悖的、降級的使用者體驗。
其背後的運作邏輯可以這樣理解:首先,Google 大力宣傳其提供「無與倫比的使用額度」,免費開放最強大的 gemini-2.5-pro 模型,這顯然是為了削弱像 Claude Code 這樣的付費競爭對手 1。然而,來自 Hacker News、Reddit 和 GitHub Discussions 的大量用戶報告指出,即使在極少量的使用下,也會一直遇到 429 Too Many Requests (請求過多) 的錯誤 12。為了解決這個問題,Gemini CLI 被設計為在偵測到高負載或延遲時,會自動且默默地將用戶的對話階段切換到功能較弱的 gemini-2.5-flash 模型 12。結果是,原本期望體驗 Pro 模型強大能力的用戶,最終卻得到了來自 Flash 模型的、品質較低且不穩定的輸出。因此,這個免費策略雖然成功地推動了產品的普及,卻也因為未能兌現其核心承諾——穩定地提供頂級模型存取——而給許多用戶留下了糟糕的第一印象。這反映出 Google 可能低估了市場需求,或是為了控制成本而採取了刻意的節流措施,無論是哪種情況,都對其產品的信譽造成了一些損害。
✦延伸閱讀:生成式AI 產業應用案例:電商如何利用 Gemini 防止交易轉向外部平台
第三節:開發者採用與真實世界應用
3.1從理論到實踐:一個完整的開發工作流程
為了具體展示 Gemini CLI 的實用價值,我們可以依據詳細的教學文件,勾勒出一個完整的開發任務流程,從而體現其端到端的能力 11。
- 程式碼庫上手 (Codebase Onboarding):一位開發者首先從 GitHub 複製 (clone) 一個陌生的專案。進入專案目錄後,他可以向 Gemini CLI 下達指令:> Explore the current directory and describe the architecture of the project (探索當前目錄並描述此專案的架構) 11。代理人會立即開始分析檔案結構,閱讀關鍵文件,並提供一份關於專案架構的高層次摘要,幫助開發者快速建立對專案的理解。
- 錯誤調查 (Bug Investigation):接著,開發者將一個 GitHub issue 的 URL 提供給代理人,例如:@search https://…/issues/1 11。代理人會利用其內建的搜尋工具讀取該 issue 的內容,分析程式碼庫中相關的部分,並提出一個包含多個步驟的錯誤修復計畫。
- 程式碼實作 (Code Implementation):開發者審閱並核准該計畫後,代理人便會使用其 Edit 工具,以 diff 的形式在多個相關檔案中應用必要的程式碼變更 8。
- 測試生成 (Test Generation):在修復完成後,開發者可以接著下達指令:> Write a pytest unit test for this change (為此變更編寫一個 pytest 單元測試) 11。代理人隨即會生成相應的測試程式碼,並將其添加到專案的測試套件中。
- 文件撰寫 (Documentation):最後,開發者可以要求代理人撰寫變更日誌:> Write a markdown summary of the bug, fix, and test coverage (為此錯誤、修復和測試覆蓋率撰寫一份 markdown 摘要) 11。這份摘要可以被直接儲存到專案的
CHANGELOG.md 檔案中。
這個流程清楚展示 Gemini CLI 如何將原本需要數小時甚至數天的人工操作,濃縮為一系列簡潔的自然語言指令,從而顯著提升開發效率。
為了更直覺地呈現這個流程,下表總結了在一個典型的修 bug 生命週期中,開發者與 Gemini CLI 的互動方式。這個表格將抽象的功能轉化為具體的步驟,對於評估該工具對團隊生產力潛在影響的工程主管來說,相信有很高的參考價值。
✦延伸閱讀:生成式人工智慧對企業動能成長的影響,從ChatGPT 到 Google Gemini
Gemini CLI 實際工作流程範例表 (修 bug 生命週期)
| 步驟 | 開發者提示範例 | Gemini CLI 的行動與推理 | 使用的底層工具 |
| 1. 上手 | > Explore and summarize this project's architecture. (探索並總結此專案的架構) |
分析目錄結構和關鍵檔案,以提供高層次的概覽。 | FindFiles, ReadManyFiles |
| 2. 錯誤分類 | > Analyze GitHub issue #1 and propose a fix. (分析 GitHub issue #1 並提出修復方案) |
獲取 issue 詳細資訊,在程式碼庫中搜尋相關函式,並擬定修復計畫。 | GoogleSearch, SearchText |
| 3. 實作 | > Proceed with the plan. (繼續執行計畫) |
以 diff 形式應用建議的程式碼變更,並在寫入磁碟前請求用戶批准。 | Edit, WriteFile |
| 4. 測試 | > Generate a unit test for the fix. (為此修復生成一個單元測試) |
建立一個新的測試函式來驗證修正後的行為,並將其加入測試套件。 | WriteFile, Edit |
| 5. 文件化 | > Create a changelog entry for this fix. (為此修復建立一筆變更日誌) |
生成一份關於問題與解決方案的 markdown 格式摘要。 | WriteFile |
3.2開發者的聲音:社群回饋綜覽
Gemini CLI 的發表在開發者社群中激起了複雜而兩極的反應。
- 初期的「驚艷」時刻:產品剛推出時,許多開發者對其表現感到驚艷。他們讚賞其反應速度 (尤其與 Claude Opus 相比)、僅用單一請求就能處理複雜任務的能力,以及其流暢的「代理人式體驗」12。許多成功案例被分享出來,例如用它來重構大型程式碼庫,或是在不同程式語言之間轉換演算法 12。
- 性能與可靠性的批評:然而,這股初期的興奮感很快就被普遍的性能問題所沖淡。最常見的抱怨集中在頻繁出現的 429 Too Many Requests 錯誤、極端的緩慢延遲,以及在壓力下被自動降級到功能較弱的 gemini-2.5-flash 模型 5。這些問題嚴重影響了使用者體驗,並使其難以在實際工作中扮演可靠的角色。
- 品質與幻覺問題:程式碼生成的品質也呈現出不一致的評價。雖然有些用戶認為其輸出品質很高,但也有不少用戶報告稱,Gemini CLI 會犯下嚴重錯誤、產生不存在的函式呼叫 (幻覺),或未能正確遵循指令,尤其是在與 Claude Code 比較時 5。
- 可用性與使用者體驗 (UX) 的爭議:Gemini CLI 在執行任務時會顯示詳細的「思考」過程,這種冗長的輸出在 UX 上引發了討論。一些用戶認為這增加了透明度,有助於理解代理人的決策過程 16。然而,另一些用戶則覺得這非常煩人,並希望得到更簡潔的結果 12。此外,其基於 Node.js 的技術選擇也成為一個爭議點。雖然這降低了許多網頁開發者的使用門檻,但也被一些人批評為對系統性能的拖累和不必要的環境依賴 12。
第四節:競爭舞台:Gemini CLI vs. 現有競爭者
Gemini CLI 的問世,直接攻進一個由其他科技巨頭早已佈局的競爭領域。本節將對其與主要競爭對手的產品進行詳細的比較分析。
4.1與 Anthropic 的 Claude Code 正面對決
Anthropic 的 Claude Code 常被視為此市場的領導者和 Gemini CLI 的主要評判標準 5。
- 定位與優勢:Claude Code 以其精緻的使用者體驗、高品質的程式碼輸出和透過「代理人式搜尋」(agentic search) 實現的深度程式碼庫感知能力而備受讚譽 13。其一個關鍵的差異化功能是「子代理人」(sub-agent) 機制,它允許主代理人為一個明確的子任務生成一個全新的上下文視窗,從而實現一種階層式的多代理人協作模式 12。
- 弱點與差異:與 Gemini CLI 激進的免費策略形成鮮明對比,Claude Code 是一款高階的付費訂閱產品,其免費方案的限制較多 13。
- 直接比較:開發者社群的普遍看法是,Claude Code 在可靠性和錯誤率方面表現更佳。然而,也有用戶指出,當 Gemini 2.5 Pro 能夠正常運作時,其反應速度可能比 Claude Code 更快 5。
4.2與 OpenAI 的 Codex CLI 正面對決
OpenAI 的 Codex CLI 則將重點放在使用者控制和安全性上。
- 定位與優勢:其核心創新是提供了三種「核准模式」(Approval Modes):Suggest (預設模式,所有操作均需批准)、Auto Edit (可自動寫入檔案,但執行指令前需批准) 和 Full Auto (在沙盒環境中完全自主操作) 20。這給予了使用者對代理人自主性程度的精細控制。與 Gemini CLI 類似,它也支援多模態輸入 21。
- 弱點與差異:Codex CLI 在本地端執行,確保了程式碼的隱私性,但它需要 OpenAI 的 API 金鑰,並且沒有像 Gemini CLI 那樣慷慨的免費方案 20。此外,其對 Windows 的支援仍處於實驗階段 20。
✦延伸閱讀:OpenAI 最新推理模型 o3 與 o4‑mini 登場:從答題者到「多工具協作代理」的時代正式開啟
4.3與 Microsoft 的 AI Shell 正面對決
相較之下,Microsoft 的 AI Shell 是一個更為專業化的工具,它深度整合於 Microsoft 的生態系統,特別是 PowerShell 和 Azure 22。
- 定位與優勢:AI Shell 的主要功能是作為一個「對話式夥伴」,幫助使用者建構複雜的 Azure CLI 和 PowerShell 指令 22。它採用了一個由多個專業「代理人」(例如 Azure 代理人、OpenAI 代理人) 組成的框架,以應對不同領域的任務 22。其與 Windows Terminal 的分割畫面整合,也是一個獨特的 UX 特色 23。
- 弱點與差異:它並非一個通用型的軟體開發代理人,其設計目標更多是輔助在 Azure 生態系中工作的系統管理員和雲端工程師,而不是像 Gemini CLI 或 Claude Code 那樣進行廣泛的程式碼庫操作和修改。
為了提供一個清晰的戰略概覽,下表對這四款領先的代理人式 CLI 進行了多維度比較。這張表格可以幫助技術決策者快速理解各平台之間的權衡,以便根據其組織的特定需求、預算和現有技術堆疊,選擇最合適的工具。
領先代理人式 CLI 比較分析
| 特性 | Google Gemini CLI | Anthropic Claude Code | OpenAI Codex CLI | Microsoft AI Shell |
| 核心 模型 |
Gemini 2.5 Pro1 | Claude 4 Opus13 | GPT-4o-mini, GPT-4.120 | GPT-4o, Copilot in Azure23 |
| 關鍵 功能 |
1M Token 上下文, ReAct 循環, 多模態輸入, GEMINI.md 設定3 | 代理人式搜尋、多檔案編輯、子代理人、IDE 整合12 | 三種批準模式(Suggest, Auto Edit, Full Auto)、本地端執行20 | PowerShell 整合、專業化代理人(Azure)、錯誤解決23 |
| 擴充性 | 模型上下文協定(MCP),擴綁模組套件1 | 模型上下文協定(MCP),SDK,GitHub Actions27 | 開源,但未強調與 MCP 的正式協定20 | 用於由開發者提供的代理人框架23 |
| 定價 模型 |
個人帳戶享慣性免費方案;Workspace/企業版需付費1 | 高級訂閱制(每月 $20~$200)、API 按量付費13 | 需使用 OpenAI API 金鑰(按用量計費)20 | 工具免費,需有 Azure/OpenAI 後端存取權限23 |
| 目標 受眾 |
廣大開發者,特別是網頁/JS 社群(基於 Node.js)10 | 專業開發者,處理大型程式碼庫的企業團隊13 | 希望對 AI 自主性與隱私有精細控制的開發者20 | Azure 雲端工程師、系統管理員、PowerShell 使用者22 |
第五節:Google 的宏大戰略:Gemini CLI 作為 AI 生態系的重要關鍵基礎
Gemini CLI 的發表並非一次單點的產品發布,而是 Google 全面推行「Gemini Everywhere」戰略的關鍵一步 7。這一戰略的核心是將 Gemini 的智慧能力嵌入到 Google 的整個產品矩陣中,從消費者應用 (如搜尋、Gmail) 到開發者工具 (如 Android Studio、Firebase),再到企業級雲端服務 (如 Vertex AI、BigQuery) 6。在這個宏大的藍圖中,Gemini CLI 扮演著「先鋒」的角色,其目標是在最基礎的層面——終端機——牢牢抓住開發者的工作流程。
5.1與 Code Assist 和 Vertex AI 的共生關係
Gemini CLI 與其在 IDE 中的對應產品 Gemini Code Assist 之間存在著明確且緊密的整合關係 1。它們被定位為同一枚硬幣的兩面:Gemini Code Assist 在 VS Code 等 IDE 中的「代理人模式」,其底層引擎正是由 Gemini CLI 驅動的 3。
這種共生關係透過共享的使用額度得到了進一步的鞏固。這意味著開發者在 IDE 和終端機中的互動,都會消耗同一個請求配額池 3。此設計旨在鼓勵開發者將這兩款工具視為一個統一的、由 Google 驅動的開發環境,從而在不同的工作場景中無縫切換。
對於企業用戶而言,Gemini CLI 則扮演了通往更強大、更可客製化的 Vertex AI 模型的門戶。它創造出一條清楚的升級路徑,從吸引大量開發者的免費方案,逐步引導至 Google 的付費企業級雲端 AI 服務,從而實現商業變現 1。
5.2模型上下文協定 (MCP) 的戰略重要性
Gemini CLI 內建對「模型上下文協定」(Model Context Protocol, MCP) 的支援,這是一項極具前瞻性的關鍵戰略決策 1。MCP 是一個新興的開放標準,旨在讓 AI 代理人能夠以一種標準化的方式連接到外部的工具、資料庫和服務,其作用類似於「AI 的 USB-C 連接埠」30。
透過擁抱 MCP,Google 傳達了一個明確的信號:它希望將 Gemini CLI 打造成一個開放、可擴充的中心,而非一個封閉的專有工具。這使得開發者能夠將 Gemini CLI 連接到一個龐大的第三方工具生態系 (例如資料庫、API、其他 AI 服務),而無需進行繁瑣的客製化整合 31。這種開放的姿態與一些競爭對手的封閉策略形成對比,是 Google 為了在 Gemini 周圍培養一個廣泛生態系的戰略性舉措,旨在避免開發者被鎖定,並鼓勵社群驅動的創新。值得注意的是,不僅是 Google,其主要競爭對手也都支援 MCP,這預示著 MCP 正在成為 AI Agent 工具彼此之間溝通的普遍標準 27。
Google 和 Anthropic 對 MCP 的早期和高調支持,可以被視為一種在 Agentic AI 領域變得支離破碎之前,搶先建立開放標準的先發制人策略。回顧科技史,其實本來就充滿了各種「協定戰爭」(例如 Betamax vs. VHS、或是 FireWire vs. USB),最終的勝利者往往能定義行業標準,並圍繞其建立起強大的生態系統。隨著 AI 代理人能力的增強,它們的價值越來越取決於它們能夠存取的外部工具 33。如果沒有一個統一的標準,每個 AI 平台 (Google, OpenAI, Anthropic, Microsoft) 都會發展出自己專有的工具整合方式。這將迫使工具開發者為不同平台維護多套整合方案,並將使用者鎖定在單一 AI 供應商的生態系中。
通過倡導像 MCP 這樣的開放標準,Google 和 Anthropic 正在對 AI 互通性下注。這降低了工具開發者支援其平台的門檻,並給予使用者更大的靈活性。這是一個高明的戰略佈局:它將 Google 定位為開放生態系的倡導者 (這對於許多被廠商陣營綁住的開發者極具吸引力),同時確保其自家的代理人 (Gemini CLI) 能夠從一個跨平台、快速增長的 MCP 相容工具庫的網路效應中獲益。這是一種不強迫所有人在自家場地比賽,卻能最終贏得比賽的策略。
✦延伸閱讀:Google Gemini 2.5 Pro、Flash、Flash-Lite思考型AI模型應用場景一次看
第六節:未來軌跡與長期影響
6.1預期演進:解決瓶頸與擴展能力
Gemini CLI 的未來發展路徑將圍繞著解決當前痛點和擴展核心能力展開。
- 首要之務:性能與可靠性。Gemini CLI 團隊最緊迫的任務是解決目前廣受詬病的性能問題,包括頻繁的 429 錯誤、高延遲,以及強制降級至 Flash 模型的使用者體驗問題。儘管 v0.1.5 和 v0.1.6 版本已針對此問題進行了修復,但社群回饋顯示問題尚未完全根除 14。穩定免費方案的體驗,是贏得長期用戶信任的關鍵。
- 功能對標與創新。基於社群的功能請求和對競爭對手的分析,Gemini CLI 的未來路線圖可能包括以下方向:
- 進階權限模型:提供更精細的權限控制,例如基於模式的權限設定 (allow Write(logs/*.txt)),以滿足企業級安全需求,並追趕競爭對手的安全功能 12。
- 階層式代理人:實作類似 Claude Code 的「子代理人」功能,允許將複雜問題分解為多個具有獨立上下文視窗的子任務,以提高解決複雜問題的能力 12。
- 優化的上下文管理:即使擁有 100 萬 Token 的超大視窗,開發者仍希望能更明確地控制上下文。未來可能提供讓開發者定義專案模組的功能,幫助代理人將注意力集中在最相關的程式碼上 12。
- 改善企業整合:解決目前 Google Workspace 和企業用戶在認證和定價方面的混亂與不便,是其商業化成功的必要條件 12。
✦延伸閱讀:Google 發布最新 AI 模型 Gemini 2.0, 助力 AI Agent 應用邁向新時代
6.2終端之戰:重塑開發工作流程與生產力
Gemini CLI、Claude Code 和 Codex CLI 之間的激烈競爭,將加速 AI 輔助軟體開發領域的創新。這場競爭將從根本上改變開發者的工作模式和基本要求,一個優秀的開發工具,現在必須包含 Agentic AI 的能力:理解高層次意圖、規劃並執行複雜的多檔案任務。
這已經催生出一種全新的開發模式,目前被一些人稱為「氛圍程式設計」(Vibe Coding) 或「對話式開發」(Conversational Development) 5。在這種模式下,開發者的核心技能可能從編寫精確的程式碼,轉變為有效地指導和與 AI 代理人協作。
長遠來看,這場終端之戰的結果將是開發者生產力的顯著提升。但同時,它也可能重新定義軟體工程師這個角色本身,未來的工程師可能需要將更多精力投入到系統架構設計、問題分解和 AI 監督上,而花在逐行編寫程式碼上的時間則會相對減少 9。這不僅是一場工具的革命,更是一場關於開發者工作方式和價值的革命。
iKala 是 Google Cloud 2025 年年度最佳合作夥伴,提供專業的顧問服務與在地化支援,協助企業評估 Gemini 2.5 的導入方式與效益,並整合至現有的雲端架構與業務流程中,如果您正在尋找能加速創新與提升營運效率的 AI 解決方案,歡迎聯繫 iKala,獲得量身打造的技術建議與實作協助。

參考資料
- Gemini CLI: your open-source AI agent – Google Blog, https://blog.google/technology/developers/introducing-gemini-cli-open-source-ai-agent/
- Everything You Need to Know About Google Gemini CLI: Features, News, and Expert Insights – TS2 Space, https://ts2.tech/en/everything-you-need-to-know-about-google-gemini-cli-features-news-and-expert-insights/
- Gemini CLI | Gemini for Google Cloud, https://cloud.google.com/gemini/docs/codeassist/gemini-cli
- Meet Gemini CLI: The AI Agent That Works in Your Shell – Techwrix, https://www.techwrix.com/meet-gemini-cli-the-ai-agent-that-works-in-your-shell/
- Google introduces Gemini CLI, a light open-source AI agent that brings Gemini directly into the terminal : r/singularity – Reddit, https://www.reddit.com/r/singularity/comments/1lk5h19/google_introduces_gemini_cli_a_light_opensource/
- What Google Cloud announced in AI this month – and how it helps you, https://cloud.google.com/blog/products/ai-machine-learning/what-google-cloud-announced-in-ai-this-month
- Google's Gemini CLI Puts AI in the Terminal – TechRepublic, https://www.techrepublic.com/article/news-google-introduces-gemini-cli/
- Gemini CLI Full Tutorial – DEV Community, https://dev.to/proflead/gemini-cli-full-tutorial-2ab5
- How to Use Gemini CLI: Complete Guide for Developers and Beginners – MPG ONE, https://mpgone.com/how-to-use-gemini-cli-complete-guide-for-developers-and-beginners/
- google-gemini/gemini-cli: An open-source AI agent that brings the power of Gemini directly into your terminal. – GitHub, https://github.com/google-gemini/gemini-cli
- Gemini CLI: A Guide With Practical Examples – DataCamp, https://www.datacamp.com/tutorial/gemini-cli
- Gemini CLI | Hacker News, https://news.ycombinator.com/item?id=44376919
- Claude Code: Deep Coding at Terminal Velocity \ Anthropic, https://www.anthropic.com/claude-code
- google-gemini gemini-cli · Discussions · GitHub, https://github.com/google-gemini/gemini-cli/discussions
- The Gemini CLI Github is LIVE : r/Bard – Reddit, https://www.reddit.com/r/Bard/comments/1lk5i3c/the_gemini_cli_github_is_live/
- Gemini CLI in 6 Minutes: Google's Free and Open-Source Coding Assistant – YouTube, https://www.youtube.com/watch?v=T76NbeTdDFA
- Gemini CLI —— WOW!!!! (2 Viewers) – Forums, https://www.access-programmers.co.uk/forums/threads/gemini-cli-wow.334271/
- Google's Gemini CLI: My First Hands-On Experience | by Dor Ben Dov | Jun, 2025 – Medium, https://medium.com/@dorbd/googles-gemini-cli-my-first-hands-on-experience-b1eafb960b9f
- Google Gemini CLI Is FREE & Crazy Powerful: Real World Coding Test & First Impressions, https://www.youtube.com/watch?v=CqL5kB8pOfo
- OpenAI Codex CLI – Getting Started | OpenAI Help Center, https://help.openai.com/en/articles/11096431-openai-codex-cli-getting-started
- OpenAI Codex CLI – YouTube, https://www.youtube.com/watch?v=FUq9qRwrDrI
- Q&A: Making the Command Line Smarter with AI Shell – Redmondmag.com, https://redmondmag.com/articles/2025/06/24/making-the-command-line-smarter-with-ai-shell.aspx
- What is AI Shell? – PowerShell | Microsoft Learn, https://learn.microsoft.com/en-us/powershell/utility-modules/aishell/overview?view=ps-modules
- PowerShell/AIShell: An interactive shell to work with AI-powered assistance providers – GitHub, https://github.com/PowerShell/AIShell
- Use Microsoft Copilot in Azure with AI Shell, https://learn.microsoft.com/en-us/azure/copilot/ai-shell-overview
- Get started with AI Shell in PowerShell – Learn Microsoft, https://learn.microsoft.com/en-us/powershell/utility-modules/aishell/get-started/aishell-powershell?view=ps-modules
- CLI reference – Anthropic API, https://docs.anthropic.com/en/docs/claude-code/cli-reference
- Claude Code overview – Anthropic API, https://docs.anthropic.com/en/docs/claude-code/overview
- Official Gemini news and updates | Google Blog, https://blog.google/products/gemini/
- Build Agents using Model Context Protocol on Azure | Microsoft Learn, https://learn.microsoft.com/en-us/azure/developer/ai/intro-agents-mcp
- Model Context Protocol (MCP) – PydanticAI, https://ai.pydantic.dev/mcp/
- What is Model Context Protocol (MCP)? – IBM, https://www.ibm.com/think/topics/model-context-protocol
- What is Model Context Protocol? (MCP) Architecture Overview | by Tahir | Medium, https://medium.com/@tahirbalarabe2/what-is-model-context-protocol-mcp-architecture-overview-c75f20ba4498
- What is Model Context Protocol (MCP)? How it simplifies AI integrations compared to APIs | AI Agents That Work – Norah Sakal, https://norahsakal.com/blog/mcp-vs-api-model-context-protocol-explained/
- How to Install & Use Gemini CLI + MCP: A Step-by-Step Tutorial – YouTube, https://www.youtube.com/watch?v=we2HwLyKYEg
- Model context protocol (MCP) – OpenAI Agents SDK, https://openai.github.io/openai-agents-python/mcp/
- The Google Gemini CLI Reveal Has Left Many Impressed and Some Unsure – Technowize, https://www.technowize.com/googles-gemini-cli-tool-reveal-has-left-many-impressed-and-some-unsure/
- Review GitHub code using Gemini Code Assist – Google for Developers, https://developers.google.com/gemini-code-assist/docs/review-github-code
- eliben/gemini-cli: Access Gemini LLMs from the command-line – GitHub, https://github.com/eliben/gemini-cli
- gemini-cli module – github.com/reugn/gemini-cli – Go Packages, https://pkg.go.dev/github.com/reugn/gemini-cli
- christian-taillon/chat-cli: Command Line tool for OpenAI's ChatGPT service – GitHub, https://github.com/christian-taillon/chat-cli
- My project – Chatterm: A CLI Tool Unveiling Command Execution & ChatGPT Integration, https://community.openai.com/t/my-project-chatterm-a-cli-tool-unveiling-command-execution-chatgpt-integration/681491
- OpenAI Codex CLI | Generative AI Tools | Vibe Coding – YouTube, https://www.youtube.com/watch?v=PRazT93lTCM
- This repository is for active development of the Azure AI CLI. For consumers of the CLI, we suggest you check out The Book of AI at https://thebookof.ai – GitHub, https://github.com/Azure/azure-ai-cli
- Azure Command-Line Interface (CLI) documentation – Learn Microsoft, https://learn.microsoft.com/en-us/cli/azure/?view=azure-cli-latest
- Use the Azure Developer CLI to deploy resources for Azure OpenAI On Your Data, https://learn.microsoft.com/en-us/azure/ai-services/openai/how-to/azure-developer-cli
- CLI (v2) AI Content Safety connection YAML schema – Azure Machine Learning, https://docs.azure.cn/en-us/machine-learning/reference-yaml-connection-ai-content-safety?view=azureml-api-2
- dvcrn/anthropic-cli: CLI for interacting with Anthropic Claude – GitHub, https://github.com/dvcrn/anthropic-cli
- simple-claude-cli – crates.io: Rust Package Registry, https://crates.io/crates/simple-claude-cli
- I Tested Gemini CLI and Other Top Coding Agents – Here's What I …, https://dev.to/therealmrmumba/i-tested-gemini-cli-and-other-top-coding-agents-heres-what-i-found-om1
- What is the usecase for gemini cli? : r/Bard – Reddit, https://www.reddit.com/r/Bard/comments/1lktcv4/what_is_the_usecase_for_gemini_cli/
- AI Shell command reference – PowerShell | Microsoft Learn, https://learn.microsoft.com/en-us/powershell/utility-modules/aishell/how-to/aishell-reference?view=ps-modules
- Gemini CLI: Google's Challenge to AI Terminal Apps Like Warp – The New Stack, https://thenewstack.io/gemini-cli-googles-challenge-to-ai-terminal-apps-like-warp/