Categories
CEOの観点

【2023年上半期】世界のAI技術発展の重要ポイント

2023年上半期における世界のAI技術発展に関する重要なポイントを11項目に分けて総括しました。これらは、iKalaのAIインフルエンサーマーケティングプラットフォーム「KOL Radar」と顧客データプラットフォーム「iKala CDP」の2つのプロダクト、またAI導入をサポートする際の経験と研究をもとに整理しました。iKalaは引き続きHugging Faceや公開論文で成果を発表していく予定です。

1. モデルを縮小してもAIブレーンの性能は維持可能か

この課題を達成することは非常に難しいです。モデルのパラメータ量は、大規模言語モデル(LLM)の能力にとって重要な要素であり、現時点では決定的な要因です。私たちは40以上のモデルをテストしましたが、ほとんどは30B以下であり、AIのブレーンを縮小すると同じ理解能力を維持することが難しいことがわかりました。論文 "The False Promise of imitating proprietary LLMs" はこの問題を総括しています。しかし、誰もが小さくても優れていて且つ速いモデルを望んでいます。そのため、研究コミュニティはモデルを縮小することに注力しています。しかし、注意すべきは、AIによるプログラミングの能力は、モデルのサイズと必ずしも必然的な関係があるわけではないということです。これは人類の認知作業とは異なる傾向を示しており、現時点ではこの現象を説明することができません。

2. 各界で自社開発したオープンソース言語モデルの発表が活発に

過去半年間で無数の公開モデルが発表され、多くの企業や開発者が自社のモデルがわずか数百(数千)ドルのコストや少量且つわずかな時間のトレーニングでGPT-4の87%の性能を持つなどと主張しています。これらの結果は参考程度に止めるべきであり、重要なのは自ら実験を行い、これらの結果を検証することです。

3. AIの私有化とカスタマイズの傾向が形成

AIを導入するプロセスが早い顧客は、市場に出回っているGPT-4、Claude、Midjourney、PaLM 2などの大規模モデルは再現が非常に困難で、ここまでの巨大なリソースを費やす必要もないと認識しています。多くの企業は「汎用型のLLM」ではなく、ビジネスモデルに応じて言語モデルの必要な能力を決定するだけで十分です。

4. モデル全体性能の縮小または特定能力の除去

大規模モデルの再現性が低く、また企業はAI導入を急ぐ傾向にあるため、現在の方向性は「産業専用モデル」のトレーニングです。その際の方法として、「言語モデルの特定の能力を直接除去する(例:聞く、話す、読むだけで書く能力を持たない)」または「モデル全体性能の縮小(例:聞く、話す、読む、書く能力を低下させる)」という手法が考えられます。これに関連して、「Distilling Step-by-Step! Outperforming Larger Language Models with Less Training Data and Smaller Model Sizes」という論文を参考にすることができます。

5. 企業がAIを導入するための複線的な考え方

現在、企業の主な焦点は、「既存のビジネスモデルにAIをどのように活用するか?」および「既存の人員の生産性をどのように向上させるか?」という点です。各組織は内部のワークフローを分解し、効率化と自動化による従業員の生産性向上を図っています。同時に、AIがビジネスモデルに付加価値をもたらすかどうかを積極的に探求しています。iKalaは、多くの企業がiKala CDPから「データミドルウェア」の構築を始めていることから、探求を加速させつつデータの整理も進めています。なぜなら、データがなければAIも成り立たないからです。将来的には必ずAIを使用することになるので、模索しながら対処可能で重要なタスクを同時に進める必要があります。そのため、AIの進展はビッグデータとクラウド市場を急速に推進しています。以前のデジタル変革は目的が不明確でしたが、現在のデジタル変革は「知的能力」を獲得するために行われており、目的が明確であり、AIの効果を実証するものとなっているため、企業主たちは積極的に投資しています。

6. 大規模モデルプラットフォーム化のトレンド形成

前述の大規模モデルにおける経済学的スケールメリットの観点から、大規模モデルの訓練と維持のコストを負担できるのはBig Techだけであり、さらにサービス単位のコストを低減して小規模な競合他社の参入を阻止することができるため、これらのモデルは全面的にプラットフォーム化へと進んでいます。これらのモデルはプライベートモデルの基盤となり、外部企業や開発者は低コストで大規模モデルが生成した結果を利用できますが、その運用の詳細情報を得ることはできず、また現在Big Techが大規模モデルの詳細を公開する要因もありません。(Metaは例外であり、後述します)政府の規制や介入などがあれば情報を開示することが考えられますが、これは長い道のりです。最終的に政策立案者はBig Techとの商業利益と国家(地域)の統治バランスを取ることになるかもしれませんが、全体的にはBig Techが大きな損害を被ることはないでしょう。

7. MetaはAIオープンソースコミュニティで先頭を走る

LLaMAとSAM(Segment Anything Model)が大きな人気を博しているため、MetaはAIの主導権をかなり取り戻しています。しかし、Metaの最も特異な点は、「直接的にAIで収益を上げていない」ということです。Google、Amazon、MicrosoftはAIをクラウドに配置して企業にレンタルさせたり、OpenAIはChatGPTのサブスクリプションを販売していますが、Metaだけが非常に強力なSNSプラットフォームのネットワーク効果によって広告収益を持続的に得ています。そのため、オープンAIにおけるMetaの積極性は、間違いなく他のBig Techを超え続けることでしょう。

8. 英語圏主導のAIモデル領域の発展

ほとんどのオープンソースモデルは明らかに英語の表現が最も優れており、これは西洋諸国と他の国々の科学技術の発展格差を拡大させ、世界中のユーザーの使用習慣を支配し、さらには特定の言語の普及を脅かす可能性があります。そのため、各国の政府や大企業が独自の大規模モデルの開発に取り組み、「言語的覇権」に抵抗しようとしています。しかし、巨額のリソースを投入して国家専用のモデルを訓練しても、重要なのは「誰がそれを使用するか?」です。AIモデルの訓練が国家レベルになると、それは技術の問題ではなく、マーケティングとサービスの問題に変わります。各国の関連部門は重点をその地域に合わせる必要があります。

9. ほとんどの生成型AIスタートアップには独自の競争優位性がない

ChatGPT自体のビジネスモデルが持続可能かどうかすら不明であり、OpenAIのAPIに頼るだけのスタートアップはさらに持続性に欠ける可能性があります。特定のビジネス領域において既に規模の経済を持つ企業は動きが遅いかもしれませんが、AIの導入と応用方法を明確にするだけで一気にこれらのスタートアップを追い越すことができます。さらに、Big Techは規模の経済によって生成型AIの使用コストを低減させることができます。これらの要因により、生成型AIのスタートアップはさらなる困難に直面しています。したがって、AIの重点は依然として「応用領域」にあり、純粋なAI技術だけに頼って起業することは非常に困難であり、初めから資本との連携を選択することになります。

10. 汎用人工知能(AGI)

AGIへの道のりは現在も非常に遠いものです。GPT-4やDeepMindの強化学習による意外な研究結果は、機械が自己行動する可能性を示していますが、現時点ではAGIを追求するさまざまな試みのほとんどは、高レベルで既存の大規模言語モデル(LLM)に各種ツールチェーンを組み合わせ、タスクを1つずつ微調整して解決している状況です。高いコストもあって、多くのオープンソースプロジェクトが中途で放棄されることもあり、完全で汎用的な解決策はまだ現れていません。AGIよりもむしろRPA(ロボティック・プロセス・オートメーション)に近い状況と言えるでしょう。

11. AIの利用には「信頼性」「ユーザーエクスペリエンス」「ビジネスモデル」が最も重要

これらはAIが人間社会の隅々まで普及するために最も重要な要素です。現在、説明可能なAI(XAI)研究分野は急速に進展していますが、まだ初期段階にあり、GPT-4のような大規模モデルは依然として巨大なブラックボックスであり、どのように意思決定や推論を行っているのかを理解するには長い道のりがあります。また、ユーザーエクスペリエンスは新しい課題です。既存の製品やサービスがどのようにAIと統合されるかは、興味深く、また新しい機会でもあり、同時にユーザーの古い習慣に挑戦する大きな課題でもあります。