下半年 AI 圈第一個重磅消息:Meta 發布 LLaMA 2,並且完全開源、商用免費。
在上個月與大家分享的 AI 2023 上半年小結文章當中,我提到 Meta 藉由 LLaMA 已經在 AI 開源社群取得了相當程度的領導地位。現在 Meta 趁勝追擊,今日(7/19) 大動作推出 LLaMA 2 ,要更加鞏固自己的地位。
相較於第一代的 LLaMA,LLaMA 二代用了 2 兆個 token (可以簡單當做是文字的數量) 來訓練,並且提供了 4,096 字數的前後文輸入長度,比前一代長了一倍。
最近 AI 的研究社群開始進行文字長度的競賽,大家在拼語言模型一次可以吞下去的 token 數量,因為這有助於語言模型展現出更完整的前後文推理,讓這些 AI 表現更好。
OpenAI 的 ChatGPT、Anthropic 的 Claude、和一些剛剛發表的研究宣稱,已經將 token 長度分別擴展到 32,768、10 萬、和 100 萬。LLaMA 2 看起來似乎短了點,不過別忘了,這當中唯一開源的就只有 LLaMA 2。
Meta 在公布 LLaMA 2 的論文當中提到,LLaMA 2 的能力依舊不如 GPT-4。不過,這恰恰凸顯出 OpenAI 的一個大麻煩:未來,每個企業都要有一個自己的 AI 大腦作為運作中心,但這個 AI 大腦並不需要像 GPT-4 這麼強大、這麼昂貴。
企業要的是客製化、能夠解決自己商業問題、「學有專精」的 AI 就好,他們並不需要一個無所不知的 AI 天神。
所以從上半年以來,自從「縮小大腦」(也請參考我之前的文章)的 AI 軍火競賽開始以來,整個趨勢不僅還在加速當中,LLaMA 2 更達成了一個新的里程碑,因為 LLaMA 2 不僅完全開源,而且 Meta 在今天還發表了一個非常重要的合作。
Qualcomm 與 Meta 攜手,將把 LLaMA 2 放在手機晶片裡面,2024 年這件事情將會成真,意味著 Meta 在 AI 的邊緣運算市場取得了先發優勢。其他 Big Tech 公司在這邊暫時還沒有與 LLaMA 2 相對應的競爭開源模型。
別忘了當年 Google 是靠著 Android 這個開源軟體,把手機的作業系統市佔率給寡佔了下來,Meta 當年錯失了手機的發展機會,只能依附在 Apple 和 Google 的生態上,時不時得因應隱私權並針對廣告商業模式做出調整,一直以來三家公司的拉扯從來沒有平息過。
今年以來祖克柏(Zuckerberg)毅然決然不再談元宇宙,把整艘 Meta 大船轉了一個大彎全力擁抱 AI,靠著(意外洩漏的)LLaMA 第一代打開了一個新的競爭局面,有機會更深入到我們每個人的手機裡面去。
別忘了我們一直以來在講的,任何的數位生意,打的都是一個生態系的戰爭,而 Meta 整合 AI 晶片、開源 AI 模型、搭配原有的強大網路效應這 3 個重要武器,在 Google 和 OpenAI / Microsoft 兩個巨頭對撞之時,橫空出市打開了一個新的 AI 戰場,打算一路從社群網路應用,垂直往下鑽到每個人的手機運算晶片裡面。
至此,已經驗證了我之前提到的,任何人說 Meta 在整個 AI 戰爭當中缺席或是落後,是完全錯判情勢。
Meta 不是後發先至,而是從一個完全不同的競爭角度切入這場 AI 大戰。大家現在對於對祖克柏的元宇宙仍舊保有質疑,不過他真的很厲害,而我一直主張,AI 的發展只會加速元宇宙的發展,幾年後回頭來看的話,祖克柏只是暫時繞個路而已。
外傳 Meta 已經在內部測試把 LLM 大語言模型大規模部署在 messenger 上面,身為一個全世界最大的對話平台,要大量創造出現在很夯的虛擬人(digital human),沒有比 Meta 旗下平台更適合的地方,我也相當肯定 Meta 會快速切入這塊市場。
所以近來如雨後春筍般出現的生成式 AI 公司,像是虛擬人公司也倍感壓力,畢竟科技巨頭一旦跟上來,擺擺尾巴,這些公司都會直接被掃到受重傷。
網路效應終究還是 Big Tech 們掌握的最有利護城河,下半年將會是這些科技巨頭的主場,純粹靠著生成式 AI 技術創業,至今還沒有明顯護城河的生成式 AI 新創,都會面臨極大的競爭壓力。
隨著 LLaMA 2 的重磅發布,產業界也遍地開花拿著越來越多的開源模型建構自己的 AI 應用,那些小心翼翼、把「獨家大語言模型」當做商業秘密和主要競爭優勢的公司,如果不再儘快建構出整個 AI 生態系,成為新的網路入口,將會被 Big Tech 既有的生態壓著打,最好的下場也許頂多是被吞噬成為一部分。
建構新的生態系談何容易,這些公司下半年將面臨關鍵的生死存亡時刻。真的好快。