AI 產業趨勢AI 趨勢洞察

Stanford 史丹佛大學發布 2025 年度 AI Index Report 趨勢報告

Home » AI 趨勢洞察 » Stanford 史丹佛大學發布 2025 年度 AI Index Report 趨勢報告
Stanford AI Index Report

人工智慧 (AI) 正在快速發展,影響著我們生活的幾乎每一個層面,從我們工作和溝通的方式,到我們如何應對複雜的全球挑戰。要追蹤這一進展、其影響以及相關的全球趨勢可能令人望而生畏。這就是 AI 指數報告 (AI Index Report) 發揮作用的地方。

什麼是 AI 指數報告 (AI Index Report)?

AI 指數報告是一項全面的年度研究,致力於追蹤、整理、提煉和視覺化與人工智慧相關的數據。該報告由史丹佛大學以人為本人工智慧研究院 (Stanford Institute for Human-Centered Artificial Intelligence, HAI) 發起和主持,旨在為政策制定者、研究人員、記者、企業高管和公眾提供公正、來源嚴謹的數據。

我們可以將 AI Index Report 視為 AI 領域的全球「國情報告」。它從廣泛的來源收集資訊——學術機構、私營企業、開源專案等等——以描繪出 AI 發展軌跡的全貌。

為何 AI Index Report 如此重要?

AI 指數報告具有幾個關鍵功能:

  1. 追蹤進展: 它衡量 AI 在各個領域(如電腦視覺、自然語言處理和機器人學)的能力、技術性能和研究趨勢方面的進步。
  2. 監測趨勢: 它突顯了在 AI 倫理、公眾認知、教育、政策、多樣性和經濟方面的關鍵發展。
  3. 輔助決策: 透過提供客觀數據,它有助於針對 AI 影響的相關討論奠定基礎,並為全球政府和組織提供基於證據的決策資訊。
  4. 促進比較: 它允許在國家、行業和時間之間進行比較,揭示 AI 發展正在加速或滯後的領域。
  5. 提高透明度: 它將分散的數據源整合到一個集中的報告當中,促進對 AI 發展的更深入理解和更高的透明度。

今年,由於 AI 的持續快速發展,整份報告的長度已經長達 456 頁!除此之外,Stanford 也把報告當中收集到的所有數據放在公開的資料夾,讓所有人都可以存取驗證,或是自己根據原始資料做進一步的深入解讀。

2025 年全球 AI 發展狀況重點摘要

  1. AI 在挑戰性基準測試上的表現持續提升:2023 年,研究人員引入了新的基準測試—MMMU、GPQA 和 SWE-bench—來測試先進 AI 系統的極限。僅一年後,性能顯著提高:MMMU、GPQA 和 SWE-bench 的分數分別提高了 18.8、48.9 和 67.3 個百分點。除了基準測試外,AI 系統在生成高品質影片方面取得了重大進展,在某些環境中,語言模型代理甚至在有限時間內的寫程式任務中超越了人類表現。
  2. AI 越來越深入日常生活:從醫療保健到交通運輸,AI 正迅速從實驗室走向日常生活。2023 年,FDA 批准了 223 個 AI 輔助醫療設備,相比 2015 年僅有的 6 個大幅增加。在道路上,自動駕駛汽車不再是實驗性質:美國最大運營商之一 Waymo 每週提供超過 150,000 次自動駕駛搭乘服務,而百度價格親民的 Apollo Go 機器人出租車隊現在已經在中國多個城市提供服務。
  3. 企業全力投入 AI,推動創紀錄的投資和使用,研究持續顯示其對生產力的強大影響:2024 年,美國私人 AI 投資增長至 1,091 億美元,這個數字幾乎是中國 93 億美元的 12 倍,英國 45 億美元的 24 倍。生成式 AI 的投資尤其具有強勁動力,在全球吸引了 339 億美元的私人投資,相較 2023 年增加了 18.7%。AI 商業使用也在加速:2024 年有 78% 的組織在使用 AI,高於前一年的 55%。同時,越來越多的研究證實 AI 提高了生產力,並在大多數情況下幫助縮小了整個勞動力的技能差距。
  4. 美國在頂級 AI 模型生產方面仍居領先地位,但中國正在縮小性能差距:2024 年,美國機構生產了 40 個重要 AI 模型,遠超中國的 15 個和歐洲的 3 個。雖然美國在數量上保持領先,但中國模型迅速縮小了品質的差距:MMLU 和 HumanEval 等主要基準測試上的性能差異從原本 2023 年的兩位數,縮小到 2024 年的幾乎相等。同時,中國在 AI 論文和專利方面繼續領先。與此同時,模型開發日益全球化,中東、拉丁美洲和東南亞等地區均有重要的模型發表。
  5. 負責任 AI (Responsible AI) 生態系發展:最近 AI 相關的意外事件急劇增加,但標準化的評估在主要產業 AI 模型開發商中仍然罕見。然而,HELM Safety、AIR-Bench 和 FACTS 等新標準提供了評估事實性和安全性的工具。在企業中,認識到 Responsible AI 風險與採取有意義行動之間存在差距。相比之下,全球政府表現出更大的急迫感:2024 年,全球 AI 治理合作加強,經濟合作與發展組織、歐盟、聯合國和非洲聯盟等組織發布了專注於透明度、可信度和其他核心 Responsible AI 原則的框架。
  6. 全球對 AI 的樂觀情緒上升,但地區的分歧仍然深刻:在中國 (83%)、印尼 (80%) 和泰國 (77%) 等國家,強大多數認為 AI 產品和服務利大於弊。相比之下,加拿大 (40%)、美國 (39%) 和荷蘭 (36%) 等地的樂觀情緒仍然低得多。不過,情緒正在轉變:自 2022 年以來,幾個先前持懷疑態度的國家的樂觀情緒明顯增長,包括德國 (+10%)、法國 (+10%)、加拿大 (+8%)、英國 (+8%) 和美國 (+4%)。
  7. AI 變得更高效、更實惠且更易獲取:在越來越強大的小型模型(Small Language Models, SLM)推動下,達到 GPT-3.5 水準的模型推理成本在 2022 年 11 月至 2024 年 10 月期間下降了 280 多倍。在 AI 的硬體層面,成本每年下降 30%,而能源效率每年提高 40%。開源權重(open weights)模型也在縮小與閉源模型的差距,在某些基準測試上,一年內的性能差距從 8% 縮小到僅 1.7%。這些趨勢共同迅速降低了使用先進 AI 的門檻。
  8. 政府在 AI 領域加大監管和投資的力度:2024 年,美國聯邦機構引入了 59 項與 AI 相關的法規,是 2023 年數量的兩倍多,且由兩倍多的機構發布。全球範圍內,自 2023 年以來,75 個國家的立法提及 AI 增加了 21.3%,從 2016 年以來則是增加了九倍。隨著關注度提高,政府也大規模投資:加拿大承諾 24 億美元,中國啟動了 475 億美元的半導體基金,法國承諾 1,090 億歐元,印度承諾 12.5 億美元,沙特阿拉伯的「超越計劃」則提出了一項 1,000 億美元的計畫。
  9. AI 和計算機科學教育正在擴展,但在準備方面的差距仍然存在:目前三分之二的國家提供或計劃提供 K-12 計算機科學教育,是 2019 年的兩倍,其中非洲和拉丁美洲取得了最大進展。在美國,過去 10 年計算機學士學位畢業生數量增加了 22%。然而,由於基本基礎設施如電力的缺乏,許多非洲國家在獲取教育資源方面仍然受限。在美國,81% 的 K-12 計算機科學教師表示 AI 應該成為基礎計算機科學教育的一部分,但不到一半的人覺得自己有能力去教這些課程。
  10. 產業在 AI 方面領先,但前沿的競爭越咬越緊:2024 年有將近 90% 的重要 AI 模型來自產業,高於 2023 年的 60%,而學術界仍然是被高度引用研究的主要來源。模型規模繼續快速增長—訓練計算每五個月翻倍,數據集每八個月,能源使用每年翻倍。然而,性能的差距正在縮小:排名第一和第十的模型之間的得分差距在一年內從 11.9% 下降到 5.4%,而前兩名現在僅相差 0.7%。前沿效能的競爭越來越激烈,也越來越擁擠。
  11. AI 因其對科學的影響獲得最高榮譽:AI 的日益重要性反映在重大科學獎項中:2024 年的兩項諾貝爾獎分別認可了深度學習的(物理學)和 AI 應用於蛋白質折疊的工作(化學),而圖靈獎則表彰了對強化學習的開創性貢獻。
  12. 複雜推理仍然是一項挑戰:AI 模型在國際數學奧林匹克問題等任務上表現出色,但在 PlanBench 等複雜推理基準測試上仍然表現不佳。即使存在可證明正確的解決方案,它們也常常無法可靠地解決邏輯任務,限制了它們在高風險環境中的實用性。

✦延伸閱讀:AI Agent 是什麼?與 AI 助理、Chatbot 差異比較和應用場景解析

更多最新資訊的補充及深度解析

整份報告美中不足的是,資料的收集日是截止到 2025 年初,因此沒有涵蓋到像是 Google Gemini Pro 2.5, Meta Llama 4, 或是 DeepSeek-GRM 的最新資訊。我們都知道,AI 的發展速度是快到每週都迭代一次。即使是一個月前的重大進展,都有可能在一個月後變得不重要了。不過,這份權威報告的意義在於追蹤過往一直以來的趨勢發展,幫助大家理解整個 AI 發展的完整脈絡。

因此,在接下來的幾篇文章當中,iKala 團隊不但將針對報告當中每一章進行深度解析,還將補充截至目前為止最新的 AI 發展,希望讀者喜歡。

Stanford 2025 AI Indes Report 報告書完整版下載連結 (456 頁)

分章節下載:

Chapter 1 – Research and Development (61 頁)

Chapter 2 – Technical Performance (86 頁)

Chapter 3 – Responsible AI (58 頁)

Chapter 4 – Economy (76 頁)

Chapter 5 – Science and Medicine (53 頁)

Chapter 6 – Policy and Governance (44 頁)

Chapter 7 – Education (31 頁)

Chapter 8 – Public Opinion (21 頁)