分類
CEO 觀點

綜觀 2023 上半年全球 AI 技術發展 11 項重點歸納

2023 上半年 AI 技術發展大躍進,這篇文章將分享 AI 實戰經驗 11 項重點,主要基於 iKala 在 AI 網紅數據行銷平台 KOL Radar(擁有全世界超過 100 萬的跨國網紅資料)、顧客數據平台 iKala CDP 兩個產品,以及我們協助客戶導入 AI 的研究發展整理而成。iKala 會持續在 Hugging Face 和公開論文中發表我們的成果。

1. 縮小模型大腦仍一樣聰明?

要達成這項任務很難,模型的參數量對於大型語言模型(LLM)的能力目前仍是決定性的關鍵,我們總計測試了 40 餘種模型,大部分在 30B 以下,發現 AI 大腦縮小就會難以維持相同的理解能力,論文 "The False Promise of imitating proprietary LLMs" 總結了這件事情。但是誰不希望模型又小、又好、又快呢?所以研究社群對於把模型縮小還是持續投入非常多的心力,不過值得注意的是:AI 寫程式的能力似乎與模型大小沒有必然關係,這跟其他人類認知工作呈現不一樣的趨勢,目前我們還無法解釋這個現象。

2. 各界爭相誇大自有開源語言模型的能力

承續上一點,過去半年來,有無數的公開模型發表,很多公司和開發者宣稱,自己用幾百(千)塊美金、少少的訓練資料、快快的訓練速度,就讓小模型的表現跟 GPT-4 有 87% 像。這些看似驚人的成果僅供參考,重要的是一定要自己部署、重製這些實驗,才能驗證其中的真實性。

3. AI 私有化和客製化的趨勢已經形成

導入 AI 進程較快的客戶已經普遍認知到,市面上的大模型諸如 GPT-4、Claude、Midjourney、PaLM 2 等等,是非常難重製的模型,況且也沒有必要耗費龐大資源,只為了把這些大模型放在自身企業當中,因為多數的企業並不需要一個「通用型 LLM」,僅需要根據商業模式決定語言模型應具備的能力。

4. 模型整體弱化或是摘除特定能力

由於重製大模型的可行性低,企業又急迫於導入 AI,所以現在的方向是訓練「產業專屬模型」,而方式則是「直接摘除語言模型的特定能力(例如只會聽說讀、但是不會寫)」或是「整個模型弱化(例如聽說讀寫一起變差)」,這部份可以參考論文 "Distilling Step-by-Step! Outperforming Larger Language Models with Less Training Data and Smaller Model Sizes"。

5. 企業導入 AI 的雙軌思維

企業主現在思考的是:「AI 如何運用於既有的商業模式?」以及「AI 如何提升既有人員的生產力?」目前每個組織都在拆解內部的工作流程,去蕪存菁加上自動化提升人員單位生產力,同時也積極探索 AI 究竟能否為企業帶來商業模式的增值。我們服務的企業多數從 iKala CDP 開始建置「數據中台」,在探索的同時也加速資料整理,因為無論如何,沒有資料就沒有 AI,既然未來一定會使用到 AI,那在摸索的同時能處理的重要任務就趕緊一起進行,所以我們看到 AI 開始快速拉動 Big Data 和 Cloud 的市場發展。以往的數位轉型目的不明,但現在的數位轉型是為了取得「智慧」,目的明確也證明 AI 真的有效,企業主也因此開始積極投入。

6. 大模型平台化的趨勢形成

承續上面提到的大模型,回到經濟學規模經濟的現象,由於大模型的訓練和維運成本只有科技巨頭有能力負擔,並且能夠降低單位服務成本阻擋小型的競爭者,這些模型正在全面走向平台化。它們會是私有模型的基礎,外部企業和開發者可以憑藉低成本調用這些大模型產出的結果,不過無法得知太多運作的細節。目前沒有任何誘因足以讓科技巨頭們揭露大模型的細節(Meta 是例外,請見下一點),除非是透過政府的監管和介入,不過這仍是條漫漫長路,而政策制定者最後可能還是會和科技巨頭取得商業利益與國家(區域)治理的平衡,整體來說科技巨頭並不會受到太多傷害。

7. Meta 已經在開源 AI 社群拔得頭籌

隨著 LLaMA 和 SAM(Segment Anything Model)受到廣大的歡迎,Meta 已經搶回相當程度的 AI 話語權,不過 Meta 最不一樣的是,這家公司並不「直接靠 AI 賺錢」,Google、Amazon、Microsoft 都將 AI 放到雲端讓企業租賃、OpenAI 在販賣 ChatGPT 的訂閱,只有 Meta 是持續靠著極其強大的社群平台網路效應賺進大筆的廣告費,所以 Meta 在開放 AI 的激進程度,肯定會持續超越其他科技巨頭。

8. 英文語系主導 AI 模型領域發展

多數的(開源)模型明顯還是在英文的表現最好,這會擴大西方國家和全世界的科技發展差距,以及主導全世界使用者日後的使用習慣,甚至危及某些語言的普及性,所以各國政府和大型私人企業開始發展屬於自己的大模型,想要抵抗這種「語言霸權」。但就算投入龐大資源訓練出國家的專屬模型,重點仍在於「有沒有人要使用?」當訓練 AI 模型拉升到國家層級的時候,已經變成是行銷和服務的問題,而不是技術的問題,各國相關單位應把重點放對地方。

9. 多數生成式 AI 新創並沒有護城河

就連 ChatGPT 本身的商業模式是否能持續運作都尚無定論,其他只依靠 OpenAI 提供 API 的新創公司就更可能無以為繼。在特定商業領域已經有經濟規模的公司雖然動作可能較慢,但只要釐清究竟如何導入且應用 AI,一個轉身就會大幅超越這些公司。再加上科技巨頭靠著經濟規模把生成式 AI 的使用成本不斷降低,這些都會讓生成式 AI 新創雪上加霜。所以 AI 的重點仍然在於「應用場域」,憑藉純粹的 AI 技術去創業是難度非常高的事情,也是第一時間就選擇加入資本戰。

10. 通用型人工智慧(AGI)

目前距離還很遙遠,儘管 GPT-4 和 DeepMind 對於 RL 的意外研究結果顯示機器有可能自我行動。但截至目前為止,各種追求突破 AGI 的努力,大部分還是在 high-level 組合各種 toolchain 加上既有的 LLM,而且能解決的 task 是以一個一個微調的方式在進行,成本高昂也導致很多中途放棄的開源專案,並沒有完全通用的解決方案出現。與其說是 AGI,仍比較像是 RPA。

11. AI 要發揮功用,最重要的是「信任」、「使用者體驗」、「商業模式」

這是 AI 要進一步擴散到人類社會每一個角落最重要的三個元素。目前可解釋 AI(XAI) 這個研究領域雖然快速崛起,但還處在很初期的發展階段,GPT-4 這種大型模型對於所有人來說,仍是一個龐大的黑箱,了解其如何做出決策和推理還有很長的一段路要走。使用者體驗則是新的課題,既有的產品和服務如何融入 AI,是令人興奮的新機會,同時也是挑戰使用者舊習慣的大題目。商業模式則如上面所述。

在〈綜觀 2023 上半年全球 AI 技術發展 11 項重點歸納〉中有 1 則留言

留言功能已關閉。