Categories
CEOの観点

生成AIは本当に仕事の生産性を向上させることができるのか? AIの使い方を学ぶ前に、まずはワークフローの見直しを

今年はAIの発展が大きく進み、それに伴い多くの労働者が自分の仕事がAIに代替されてしまうのではないかと不安になっています。しかし実際のところAIは、仕事を代替するのではなく、タスクを代替するのです。 現時点での観察によると、AIが各業界に与える影響は異なり、AIの発展はもろ刃の剣のようなもので、担当する業務がAIの能力と高度に重複している場合、AIの直接的影響を心配する必要があります。また一方でAIは、労働者の生産性を向上させる補完的なツールになる可能性があります。 例えば私たちは、ウェブ上でライターの執筆記事やブログ、マーケティングコンテンツが急増している傾向を観察しています。これは以前はライターが、1 日に 1 つのコンテンツしか作成できなかったところ、AIの活用により 1 日に 3 つの記事を作成できるようになり、さらには外部のトレンドを検出するためのAIツールを活用して記事を豊かにすることさえも可能になっているためです。このように実際にAIはコンテンツ制作のスピードを加速させました。

ではAIを日常業務にどのように活用するか?これは、労働者が自分自身や自分のチーム、さらには企業全体を振り返る必要がある問題です。そのため、日々の業務プロセスを研究することが非常に重要です。AIは一部のタスクのプロセスを高速化できますが、遅くなる場合もあり、AI は万能薬ではありません。 特定の言語やスキルが標準機能になるのと同じように、AI が仕事の標準機能になると、労働者はAIが舞台裏でどのように機能するかを知る必要はありませんが、AI の使用方法を理解する必要があります。

今年7月、Nielsen Norman Group(ニールセン・ノーマン・グループ)はレポート (AIにより従業員の生産性が66%向上) を発表し、生成AIが生産性に最も大きな影響を与える 3 つの分野について説明しました。 まず、カスタマーサービスに関して言えば、当初チャットボットの登場でカスタマーサービスのスタッフは全員失業してしまうのではないかと考えた人がほとんどでした。 しかしこのような事態が起こらなかったのは、カスタマーサービススタッフが回答する情報が、非常に正確性を求められるからです。特に顧客からの苦情に対処する場合、細心の注意を払う必要があり、顧客の感情を和らげる方法を用いることが重要です。このような細かい処理にChatGPTを適用した場合、現状では結果を予測することは不可能です。すなわちチャットボットに明示的且つ指示通りに処理するよう求めようとしても、結果を予測することができません。このような不確実性の高さのため、誰もがChatGPTをカスタマーサービスの分野に適用することを躊躇するでしょう。結局のところ、誰も顧客を怒らせたくありません。そのため、顧客サービスの分野ではあまり進歩がなく、依然としてチャットボットの標準化を試す段階にいます。

2つ目は、コンテンツ生成の分野で、この分野においては生産性が50%以上大幅に向上しました。 米国マサチューセッツ工科大学の研究者らは今年3月、生成AIがコンテンツ生成に与える影響を定量化する論文(Experimental Evidence on the Productivity Effects of Generative Artificial Intelligence)を発表。 人々がデジタルツールと切り離せない時代において、これらのツールは、コピーライティング、翻訳、レポートの作成、説明会や議事録の作成など、情報交換やコンテンツ制作に関連しており、デジタルワーカーはほぼ毎日行っている作業です。ワークフローにおいてChatGPTは、アイデアの生成と草案作成を支援しますが、編集に関しては、作業者にとってより多くの時間がかかることが研究者らによってわかりました。作業者が長いレポートを受け取った場合、その編集や修正に時間がかかるため、作業者は修正するよりも、すべて自分で書き直したいと思うかもしれません。 ChatGPTは調査を経て意見を出したり、計画を立てたり、大規模な枠組みの簡単な草案を作るのには適していますが、細かい内容を書くことは難しく、この部分は作業者が自分でやる必要があります。しかしながら全体としては、ChatGPTを使用するとタスク処理の時間を短縮できます。研究者らはAIツールを使用すると、生産性が37%向上し、これは労働時間の約40%削減に相当し、さらに質が20%近く向上することを示しています。このことから生成AIは、質と効率を同時に最適化できると言えます。

最後に、AIによって最も生産性が向上した領域に焦点を当てると、それはソフトウェアエンジニアのプログラム作成であり、生産性が125%以上向上することがわかりました。つまり、一単位の時間あたり1行しかプログラムを作成できなかったところ、AIの助けを借りることで、ソフトウェアエンジニアは2〜3行のプログラムを作成できることになり、この結論は多くの人に驚きを与えました。しかしながら業界の状況を見ると、シリコンバレーでは今年約50万人のソフトウェアエンジニアが解雇されており、テクノロジー企業はAIがもたらす付加価値に着目し、積極的に人員配置を調整している現状があります。これは、AIが当初は科学やエンジニアリング以外の仕事に影響を与えると広く信じられていましたが、現在ではその結果が逆であることを示しています。

全体として、AIの役割は重要な生産性向上ツールとして見なされるべきですが、AI は役職を完全に置き換えるのではなく、むしろワークフローを再構築するものであると言えます。 したがってAI時代には、誰もが自分の業務プロセスにAIをうまく活用し、業務の効率と価値を高める方法を理解する必要があります。 人々は働き、そこに意味を見出さなければなりませんが、AIはあくまで補助的なツールであり、主役になるものではありませんし、主役になる必要もありません。

Categories
CEOの観点

MetaのLLaMA2に関する情報公開から、今後のAI産業の発展動向を探る

下半期AI業界の重要情報:Metaが完全オープンソースで商用利用も無料なLLaMA2 を発表

【2023 年上半期】世界のAI技術発展の重要ポイントにて、MetaはLLaMAを通じAIオープンソースコミュニティにおいてリーダーとしての地位を確立していることを共有しました。

そしてMetaはこの勢いに乗り、7 月 19 日にはLLaMA2 を発表。自社の地位、優位性をさらに強化しています。

LLaMA2 は第一世代のLLaMAに比べて、2 兆トークン(簡単にテキストの量と考える)を用いて訓練され、前後の文脈入力の長さは 4,096 単語に拡張。前の世代と比べ 2 倍に長くなりました。

最近、AI研究のコミュニティでは、テキストの長さの競争が始まっており、言語モデルが一度に処理できるトークンの数に注目が集まっています。これは前後の文脈からの推測をより完全なものにし、AIの性能を向上させるのに役立つのです。

OpenAIのChatGPT、AnthropicのClaude、そして最近発表されたいくつかの研究によれば、それぞれトークンの長さを 32,768、10 万、さらには 100 万に拡張しています。LLaMA2 はそれらに比べると少し短く見えるかもしれませんが、忘れてはいけないのは、LLaMA2 が唯一のオープンソースであるという点です。

MetaはLLaMA2 に関する論文で、LLaMA2 の能力はまだGPT-4 には及ばないと述べています。しかし、これはOpenAIにとっての大きな問題を浮き彫りにしています。

将来、各企業は自社運営のためのAIを持つ必要がありますが、そのAIはGPT-4 のように強力で且つ高価である必要はありません。 企業が必要とするのはカスタマイズ可能で、自社のビジネスにおける問題を解決できる「専属的」なAIです。ここでは全知全能で神のようなAIは求められていないのです。

上半期から "人工知能の脳を小さくする" というAI開発競争が加速している傾向があり、その観点から見てもLLaMA2 は新たな段階に達しています。

QualcommとMetaが手を組み、LLaMA2 をスマートフォンのチップに組み込むことが 2024 年に実現するということは、MetaがAIのエッジコンピューティング市場で先行優位を得たことを意味します。

他のBig Techは、まだLLaMA2 に対応する競合のオープンソースモデルを持っていません。 忘れてはいけないのは、かつてGoogleがAndroidというオープンソースソフトウェアを活用してスマートフォンのオペレーティングシステム市場を独占したことです。Metaは当時、スマートフォン発展の機会を逃し、AppleとGoogleのエコシステムに依存してプライバシーの問題や広告のビジネスモデルに対応する必要があり、三社間の対立はずっと続いてきました。

今年、ザッカーバーグ氏はメタバースについて語ることをやめ、Meta全体は一転してAIに全力を注ぐ方針に転換しました。偶然のリークによって明らかになったLLaMA第一世代によって、新たな競争局面が生まれ、Metaは私たち一人ひとりのスマートフォンにより深く入り込むチャンスを手に入れました。

私たちがこれまで語ってきたように、デジタルビジネスは常にエコシステムの戦いです。そしてMetaはAIチップの統合、オープンソースAIモデル、既存の強力なネットワーク効果の 3 つの重要な武器を使って、GoogleとOpenAI/Microsoftとの対決に新しいAIの戦場を開拓しました。

これによりAIの競争にMetaが存在しない、遅れをとっていると言われていることが完全に間違っていると証明されました。

Metaは後発ではなく、AI競争に完全に異なる視点から参入しています。現在、人々はザッカーバーグ氏のメタバースに対して疑問を持っているかもしれませんが、彼は本当に優れた能力を持っています。

そして私は常に主張してきたように、AIの発展はメタバースの発展を加速させるだけであり、数年後にはザッカーバーグ氏のアプローチが成功だったとわかるでしょう。

MetaはLLM大言語モデルをMessenger上で大規模に展開する内部テストを行っているという噂があります。世界最大の対話プラットフォームであるMessengerには、人気のあるデジタルヒューマンを大量に創造するのに最適な場所があり、私はMetaがこの市場に迅速に参入すると確信しています。そのため、最近登場したような生成型AI企業は競争のプレッシャーを感じているでしょう。Big Techが参入すれば、これらの企業は直接衝撃を受ける可能性があります。

ネットワーク効果は結局、Big Techが保有している最も有利な競合を守る要素です。下半期はこれらBig Techの主戦場となるでしょう。純粋に生成型AI技術に依存して創業している新興企業は、明確な競合優位性を持っている企業がまだ存在しないため、非常に激しい競争圧力に直面しています。

LLaMA2 の重要なリリースとともに、業界はますます多くのオープンソースモデルを使用して独自のAIアプリケーションを構築しています。独自の大規模言語モデルをビジネス機密と主要な競合優位性として扱う企業は、新しいAIエコシステムをすぐに構築しなければ、既存のBig Techに圧倒されてしまう可能性があり、良くてもBig Techの一部として飲み込まれる可能性があります。

しかし新しいエコシステムを構築することは容易ではなく、これら企業は下半期に存亡の危機に直面しています。業界の展開はこれほどまでに速いのです。

Categories
CEOの観点

【2023年上半期】世界のAI技術発展の重要ポイント

2023年上半期における世界のAI技術発展に関する重要なポイントを11項目に分けて総括しました。これらは、iKalaのAIインフルエンサーマーケティングプラットフォーム「KOL Radar」と顧客データプラットフォーム「iKala CDP」の2つのプロダクト、またAI導入をサポートする際の経験と研究をもとに整理しました。iKalaは引き続きHugging Faceや公開論文で成果を発表していく予定です。

1. モデルを縮小してもAIブレーンの性能は維持可能か

この課題を達成することは非常に難しいです。モデルのパラメータ量は、大規模言語モデル(LLM)の能力にとって重要な要素であり、現時点では決定的な要因です。私たちは40以上のモデルをテストしましたが、ほとんどは30B以下であり、AIのブレーンを縮小すると同じ理解能力を維持することが難しいことがわかりました。論文 "The False Promise of imitating proprietary LLMs" はこの問題を総括しています。しかし、誰もが小さくても優れていて且つ速いモデルを望んでいます。そのため、研究コミュニティはモデルを縮小することに注力しています。しかし、注意すべきは、AIによるプログラミングの能力は、モデルのサイズと必ずしも必然的な関係があるわけではないということです。これは人類の認知作業とは異なる傾向を示しており、現時点ではこの現象を説明することができません。

2. 各界で自社開発したオープンソース言語モデルの発表が活発に

過去半年間で無数の公開モデルが発表され、多くの企業や開発者が自社のモデルがわずか数百(数千)ドルのコストや少量且つわずかな時間のトレーニングでGPT-4の87%の性能を持つなどと主張しています。これらの結果は参考程度に止めるべきであり、重要なのは自ら実験を行い、これらの結果を検証することです。

3. AIの私有化とカスタマイズの傾向が形成

AIを導入するプロセスが早い顧客は、市場に出回っているGPT-4、Claude、Midjourney、PaLM 2などの大規模モデルは再現が非常に困難で、ここまでの巨大なリソースを費やす必要もないと認識しています。多くの企業は「汎用型のLLM」ではなく、ビジネスモデルに応じて言語モデルの必要な能力を決定するだけで十分です。

4. モデル全体性能の縮小または特定能力の除去

大規模モデルの再現性が低く、また企業はAI導入を急ぐ傾向にあるため、現在の方向性は「産業専用モデル」のトレーニングです。その際の方法として、「言語モデルの特定の能力を直接除去する(例:聞く、話す、読むだけで書く能力を持たない)」または「モデル全体性能の縮小(例:聞く、話す、読む、書く能力を低下させる)」という手法が考えられます。これに関連して、「Distilling Step-by-Step! Outperforming Larger Language Models with Less Training Data and Smaller Model Sizes」という論文を参考にすることができます。

5. 企業がAIを導入するための複線的な考え方

現在、企業の主な焦点は、「既存のビジネスモデルにAIをどのように活用するか?」および「既存の人員の生産性をどのように向上させるか?」という点です。各組織は内部のワークフローを分解し、効率化と自動化による従業員の生産性向上を図っています。同時に、AIがビジネスモデルに付加価値をもたらすかどうかを積極的に探求しています。iKalaは、多くの企業がiKala CDPから「データミドルウェア」の構築を始めていることから、探求を加速させつつデータの整理も進めています。なぜなら、データがなければAIも成り立たないからです。将来的には必ずAIを使用することになるので、模索しながら対処可能で重要なタスクを同時に進める必要があります。そのため、AIの進展はビッグデータとクラウド市場を急速に推進しています。以前のデジタル変革は目的が不明確でしたが、現在のデジタル変革は「知的能力」を獲得するために行われており、目的が明確であり、AIの効果を実証するものとなっているため、企業主たちは積極的に投資しています。

6. 大規模モデルプラットフォーム化のトレンド形成

前述の大規模モデルにおける経済学的スケールメリットの観点から、大規模モデルの訓練と維持のコストを負担できるのはBig Techだけであり、さらにサービス単位のコストを低減して小規模な競合他社の参入を阻止することができるため、これらのモデルは全面的にプラットフォーム化へと進んでいます。これらのモデルはプライベートモデルの基盤となり、外部企業や開発者は低コストで大規模モデルが生成した結果を利用できますが、その運用の詳細情報を得ることはできず、また現在Big Techが大規模モデルの詳細を公開する要因もありません。(Metaは例外であり、後述します)政府の規制や介入などがあれば情報を開示することが考えられますが、これは長い道のりです。最終的に政策立案者はBig Techとの商業利益と国家(地域)の統治バランスを取ることになるかもしれませんが、全体的にはBig Techが大きな損害を被ることはないでしょう。

7. MetaはAIオープンソースコミュニティで先頭を走る

LLaMAとSAM(Segment Anything Model)が大きな人気を博しているため、MetaはAIの主導権をかなり取り戻しています。しかし、Metaの最も特異な点は、「直接的にAIで収益を上げていない」ということです。Google、Amazon、MicrosoftはAIをクラウドに配置して企業にレンタルさせたり、OpenAIはChatGPTのサブスクリプションを販売していますが、Metaだけが非常に強力なSNSプラットフォームのネットワーク効果によって広告収益を持続的に得ています。そのため、オープンAIにおけるMetaの積極性は、間違いなく他のBig Techを超え続けることでしょう。

8. 英語圏主導のAIモデル領域の発展

ほとんどのオープンソースモデルは明らかに英語の表現が最も優れており、これは西洋諸国と他の国々の科学技術の発展格差を拡大させ、世界中のユーザーの使用習慣を支配し、さらには特定の言語の普及を脅かす可能性があります。そのため、各国の政府や大企業が独自の大規模モデルの開発に取り組み、「言語的覇権」に抵抗しようとしています。しかし、巨額のリソースを投入して国家専用のモデルを訓練しても、重要なのは「誰がそれを使用するか?」です。AIモデルの訓練が国家レベルになると、それは技術の問題ではなく、マーケティングとサービスの問題に変わります。各国の関連部門は重点をその地域に合わせる必要があります。

9. ほとんどの生成型AIスタートアップには独自の競争優位性がない

ChatGPT自体のビジネスモデルが持続可能かどうかすら不明であり、OpenAIのAPIに頼るだけのスタートアップはさらに持続性に欠ける可能性があります。特定のビジネス領域において既に規模の経済を持つ企業は動きが遅いかもしれませんが、AIの導入と応用方法を明確にするだけで一気にこれらのスタートアップを追い越すことができます。さらに、Big Techは規模の経済によって生成型AIの使用コストを低減させることができます。これらの要因により、生成型AIのスタートアップはさらなる困難に直面しています。したがって、AIの重点は依然として「応用領域」にあり、純粋なAI技術だけに頼って起業することは非常に困難であり、初めから資本との連携を選択することになります。

10. 汎用人工知能(AGI)

AGIへの道のりは現在も非常に遠いものです。GPT-4やDeepMindの強化学習による意外な研究結果は、機械が自己行動する可能性を示していますが、現時点ではAGIを追求するさまざまな試みのほとんどは、高レベルで既存の大規模言語モデル(LLM)に各種ツールチェーンを組み合わせ、タスクを1つずつ微調整して解決している状況です。高いコストもあって、多くのオープンソースプロジェクトが中途で放棄されることもあり、完全で汎用的な解決策はまだ現れていません。AGIよりもむしろRPA(ロボティック・プロセス・オートメーション)に近い状況と言えるでしょう。

11. AIの利用には「信頼性」「ユーザーエクスペリエンス」「ビジネスモデル」が最も重要

これらはAIが人間社会の隅々まで普及するために最も重要な要素です。現在、説明可能なAI(XAI)研究分野は急速に進展していますが、まだ初期段階にあり、GPT-4のような大規模モデルは依然として巨大なブラックボックスであり、どのように意思決定や推論を行っているのかを理解するには長い道のりがあります。また、ユーザーエクスペリエンスは新しい課題です。既存の製品やサービスがどのようにAIと統合されるかは、興味深く、また新しい機会でもあり、同時にユーザーの古い習慣に挑戦する大きな課題でもあります。

Categories
CEOの観点

AI 進歩フォーラムの共有(Part 2):人道的観点から見る AI

Taiwan Science and Technology Hub(Taiwan S&T Hub)は、この変革の波の中において、台湾の業界、政府、学会、研究機関が世界の技術と最前線の動向把握を支援するために、国際的に有名なAI専門家、李飛飛氏(Fei-Fei Li)を招待しました。現在スタンフォードの人間中心AI研究所所長、またImageNetのチーフサイエンティストで、AI4ALLの共同創設者および会長でもある李飛飛氏(Fei-Fei Li)は、3月23日に開催された「AI進歩:テクノロジーの展望と産業への応用」のフォーラムに参加し、国内の専門家と共に、AIを人類にとって重要な原動力とする方法について交流しました。このフォーラムは、Digital Timesの顧問である盧諭緯氏(Lu Yu-Wei)が司会を務め、業界の専門家である和碩聯合科技(Foxconn Interconnect Technology)理事長の童子賢氏(Tung Tzu-Hsien)、PChome CEOの張瑜珊氏(Jan Hung-tze)、iKala共同創業者兼CEOの程世嘉氏(Sega)がゲストとして参加しました。

以下の記事は、当社 iKala の共同創設者兼 CEOである程世嘉(Sega)がフォーラムで共有した内容(Part 2)です。

司会:盧諭緯氏(Lu Yu-Wei)

会場にいた高校生の一人が質問をしました。「今多くの人が、プログラムやソフトウェアの学習を奨励していますが、AI時代において、どの程度AIについて学ぶべきでしょうか?AIツールを学ぶべきか、背後の原理を学ぶべきか、それとも本当にモデルを開発する必要があるのでしょうか?」

iKala 共同創設者兼 CEO:程世嘉(Sega)

私にも8歳の娘がいるため、最近は子供たちにプログラミング言語を学ばせるべきかどうかという問題に直面しました。私自身は、今すぐに学ぶ必要はないと考えです。これはあくまで私の結論であり、国民的な運動にする必要はありません。

私は、2つの観点から見る必要があると思います。1つ目はAIの観点から見ることです。AI には、コンピューターシステムの再設計を振り返るという研究の方向性があります。現在のコンピューターシステムは、人間の利便性のために、段階的に抽象化されてきました。その結果、中間言語が多く、プログラミング言語、自然言語などと続きますが、AIにとってこの中間部分は不要です。したがって、私は、今後の研究方向として、AIが非常に効率的なプログラミング言語を設計し直すことが予想され、またそれが新しいプログラミング言語になるかもしれません。確かなことのは、プログラミング言語の変化のペースが速くなることです。 プログラミング言語は常に進化していることは言うまでもありませんが、現在の選択と10年後の選択はまったく異なります。 AI はプログラミング言語のイテレーションを加速し、人類の歴史の中で最も効率的なプログラミング言語を作り出す可能性があります。 それから学び始めるのも遅すぎることはありません。

2つ目は、現在のAIとのやり取りがすでに自然言語のレベルに達しているということです。言語教育を行う人の中には、「言語教育の機関は必要なくなった。AIが先生になれる。」と言う人もいますが、私は完全に違うと思います。なぜなら、自然言語はますます重要になるからです。まず、ChatGPTとコミュニケーションを取る前に、適切なプロンプトを設計する必要があります。正しい答えを導く方法を見つけ、正しい質問をする必要があります。それは人と人とのコミュニケーションだけでなく、AIとのコミュニケーションでも非常に重要です。なぜなら、AIはただそこにあるだけの何も知らない存在であり、適切な質問をした場合にのみ適切な答えを与えてくれるからです。そのため私は自然言語がより重要であると考えます。人間にとって言語は単なるスキルではなく、新しい思考方法を学ぶことでもあります。そして、多くの言語を学ぶことで、批判的思考、多様な思考視点、創造性を持つことができます。イノベーションは、遠く離れた2つの事柄を組み合わせることで生まれるものです。なぜ人間にはこの能力があるのかというと、これは人間の言語能力によって形成されたものだからです。つまり、より多くの言語が、より多様な思考の枠組みと能力を持っているということです。

教育の話に戻りますが、プログラミング言語は学ぶべきでしょうか?私は、将来的には英語のように一般教養科目になるかもしれないと思いますが、プログラミング言語を学ぶために学ぶということは避けるべきです。さらに、AIがプログラミング言語の設計やコンピュータシステム全般を改善し続ける可能性があることを考えると、将来的には人々がプログラミング言語を学ぶ必要がなくなるかもしれません。今後起こるであろうことは誰にも分かりませんが、私たちは常に生涯学習の必要性を提唱しています。したがって、学生であれば、自信を持つこと、自己管理すること、そして自己学習をすることが最も重要だと思います。これらはAI時代にも変わることはありません。

司会:盧諭緯氏(Lu Yu-Wei)

スタートアップが初期段階で直面する、データが少ないという問題をどのように見ており、またより多くのデータを取得するためにどのような戦略を提案しますか?

iKala 共同創設者兼 CEO:程世嘉(Sega)

何よりもまず、AIはすでにオープンなコミュニティです。多くの人々によって訓練されたベースモデルやオープンデータセットなどたくさんのモデルがあります。そのため戦略の1つは、数百万ドルの費用がかかる可能性のある新しいモデルをゼロからトレーニングしようとするのではなく、十分にトレーニングされたベースモデルを利用することです。ベースモデルは子供の脳のようなものであり、与えたい知識や情報を自分で追加、トレーニングする必要があります。つまり、今日ではすべての企業が自社の頭脳をトレーニングすることができ、またそのコストは継続して低下しています。

将来 AI テクノロジーは広く利用できるようになるかもしれませんが、データは最終的に最も重要な要素です。 研究全体がスモールデータに向かって進んでいることは確かです。 実際、人間の脳は信じられないほど効率的で、20〜 25ワットの電力しか消費しません。つまり、人間は1日にハンバーガーを1つ食べるだけで、 GPT を1日動かしているようなものです。 ただし、GPT は1日中運用すると、数万ドル、場合によっては数百万ドルの費用がかかる可能性があり、人間の脳はまだ非常に効率的である言えます。 人間の脳は、非常に小さなデータから強大なことを学習できますが、これは AI がまだ不十分な領域です。 

司会:盧諭緯氏(Lu Yu-Wei)

未来のAIエコシステムについてどのように考えるべきですか?

iKala 共同創設者兼 CEO:程世嘉(Sega)

ここ数年の AI 研究の急速な発展は、研究コミュニティの開放性によるものであるという傾向があります。2017年のGoogleのTransformer、2018年のGoogleのBERT、2019年のMetaのRoBERTa、そしてStanfordのFoundation Modelなど、AIのブレークスルーは、皆が積み重ねてきたものです。しかし、現在ChatGPTの集大成により、この開放性には逆転の兆候が見られます。つまり悲観的な見方をすると、AIの影響力が営業機密になるほど大きくなると、特に大手AI企業は自社の研究を保護し始め、AIの研究が閉鎖的になる可能性があります。将来のAIエコシステムは過去10年間のように超高速で発展し、すべてのものが発表されるわけではなくなるかもしれませんが、確実に進歩を続けます。なぜなら、私たちにはまだ先進的な学術コミュニティがあり、AIの研究を推進しているからです。以上は、研究コミュニティ全体から見た場合ですが、産業面から見るとAIはやはり水や電気のようなものになり、既存のビジネスモデルに付加価値を加える方法を考える必要があります。これには、コンテクストを見つけることが必要です。

台湾の優位性は、ハードウェアの製造です。これは世界的にも最高水準で、半導体やハードウェアのサプライチェーンにおいて台湾は必要不可欠な存在であり、これらはかけがえのない資産です。現在、AI に必要なコンピューティング能力が不足しており、最新のハードウェアにアクセスできるのは大企業のみであるため、台湾の半導体産業は引き続き発展すると予想され、これらの不足は今後数年間は続くでしょう。ソフトウェア産業においては、世界を視野に入れることが重要であり、台湾をイスラエルやシンガポールと同じように考える必要があります。ソフトウェア産業は規模を追求するため、台湾の2300万人の人口では十分ではなく、他の市場も加える必要があります。AIやその他のソフトウェアについても、最初の一歩は台湾から世界を見ることが重要です。

司会:盧諭緯氏(Lu Yu-Wei)

親としてSegaは将来の子供たちにどのような AI の世界で暮らしてもらいたいですか? また、私たちに今できることは何ですか?

iKala 共同創設者兼 CEO:程世嘉(Sega)

時間軸を引き伸ばすと、50年、100年、200年後には、デジタルテクノロジーの発展はただの段階に過ぎず、100年後には、遺伝子編集、タンパク質、新薬、不老不死、宇宙探査など、これら全てがAIによって支援されるようになるかもしれません。テクノロジーは常に中立的であり、人類の選択次第でどう使うか、使わないかが決まります。AIの影響力がすでに至る所に及んでいる今、我々が決めなければならないのは、どの領域で使ってはならないのか?どの領域を開かれたままにするべきなのか?どの領域を制限的に使用するべきなのか?という問題です。これらは今後大きな問題になるでしょう。

現在、人々の間で二極化が進んでおり、技術の進歩が格差を広げ続ける中で、最も問題なのは、なぜ技術の進歩が社会全体に影響を与えるのかということです。

これは、人間が良い生活を送れないからではなく、人間の不平等さがますます増しているところに大きな原因があります。100年前よりも今の私たちはより豊かな生活を送っていますが、なぜ不満が生じるのか、それは不平等さからです。技術がこれをさらに大きくすると、社会が崩壊する可能性があり、これもAIが引き起こす非常に重要で且つ解決しなければならない問題だと思います。したがって、私たちは技術の観点ではなく、社会の観点からAIを見る必要があると考えています。この急速に進む変革の中で、私たちができることは、できるだけ多くの人がこの変革の波に乗る、または乗りやすくすることで、これは産業革命から得たインスピレーションでもあります。そこで私たちが次にやろうとしているのは、AI の観点からの人道主義ではなく、人道的な観点から AI を見ることです。

 

 

Categories
CEOの観点

AI 進歩フォーラム(Part 1):AI が人々に価値を創造するためにはコンテクストが必要

Taiwan Science and Technology Hub(Taiwan S&T Hub)は、この変革の波の中において、台湾の業界、政府、学会、研究機関が世界の技術と最前線の動向把握を支援するために、国際的に有名なAI専門家、李飛飛氏(Fei-Fei Li)を招待しました。現在スタンフォードの人間中心AI研究所所長、またImageNetのチーフサイエンティストで、AI4ALLの共同創設者および会長でもある李飛飛氏(Fei-Fei Li)は、3月23日に開催された「AI進歩:テクノロジーの展望と産業への応用」のフォーラムに参加し、国内の専門家と共に、AIを人類にとって重要な原動力とする方法について交流しました。このフォーラムは、Digital Timesの顧問である盧諭緯氏(Lu Yu-Wei)が司会を務め、業界の専門家である和碩聯合科技(Foxconn Interconnect Technology)理事長の童子賢氏(Tung Tzu-Hsien)、PChome CEOの張瑜珊氏(Jan Hung-tze)、iKala共同創業者兼CEOの程世嘉氏(Sega)がゲストとして参加しました。

以下の記事は、当社iKalaの共同創設者兼CEOである程世嘉(Sega)がフォーラムで共有した内容(Part 1)です。

司会:盧諭緯氏(Lu Yu-Wei)

Segaは、ソフトウェアエンジニアリングのバックグラウンドを持ち、ソフトウェア開発に注力するスタートアップを設立した人物として、AI の強化を会社の重要な目標にしてきました。 AIが将来のソフトウェア産業、またはソフトウェアサービスに与える影響についてどのように捉えているか、考えを教えてください。

iKala 共同創設者兼 CEO:程世嘉(Sega)

私たちが実際にスタンフォード大学のコンピューターサイエンスビジョンの研究をしていた2006年当時はまだ、クラウドもビッグデータも AI も iPhone もなく、研究は非常に困難でした。現在、我々はAI、ビッグデータ、クラウドのことをABCと言っていますが、実際の発展の順序はCBAで逆になります。まずクラウドがあり、それからビッグデータができ、そしてAIがアルゴリズムや計算能力、データを持つことができるようになったことで、AIが急速な飛躍を遂げることなりました。これがAIの発展の過程です。iKala が当初、Human-Centered AI Company(人間中心のAIカンパニー)と称したのはそのためで、これは AI が代替ではなく拡張であると信じているからです。実際、産業の観点から見ると、医療や健康、小売、さらには軍事など、AIには力を発揮するコンテクストが必要です。コンテクストがなければ、AIは役に立ちません。そのため、この波、特にGPTがもたらした大きなターニングポイントに実は非常に驚きを持っています。私たちは、GPT のような技術が登場するのは 3年後だと思っていましたが、OpenAI はそれを3年早めました。

業界にとって、これは前向きな発展だと考えています。人々はすでに AI のムーアの法則について話し始めており、今後はAIの能力が1年半から2年ごとに倍増したり、コストが下がったりするわけではなく、3ヶ月ごとにコストが半分になることがあるかもしれません。ChatGPTが登場した後、ソフトウェア業界はAIを小さくする方法を探っています。例えば、TeslaのAI責任者であるアンドレイ(Andrej)は、nanoGPTプロジェクトを開始し、AIのトレーニングコスト、展開コスト、アプリケーションコストなどを継続的に削減することを目指しています。このように、ムーアの法則は実際に AI 業界にも現れ始めています。皆さんが思いつくところでいくと AI research community。これは非常にオープンなコミュニティであり、さまざまなモデルとデータセットを有し、論文が出れば、データセットと一部のソースコードはすべて公開され、翌日には入手できるため、AI の進歩をより加速しています。 私たちは、新しいムーアの法則の下で、最終的には AI がすべての人が利用可能になる、つまり、インテリジェンスを取得するためのコストがますます低くなると予想しています。

AIがビジネスに与える影響が大きいとされる理由は、過去にDXが話題になった際、投資利益率を計算できないという意見があったためです。そのため、DXに疑いを持ち、長期的なコスト効果が何であるかわからないという状況がありました。しかし、DXの目的がインテリジェンスを獲得することである場合、それは各業界に新たな波を引き起こすことになります。したがって、インテリジェンスを得るためのコストがほぼゼロである場合、人々が心配する問題、すなわち「既存のワークフローが変わってしまうのではないか?既存の個人生産性が10倍に増える可能性はないか?」などが生じる可能性があります。そこで、AIをユーティリティ(公益なもの)として捉え、水や電気と同じように考えることが重要であると思います。10年または20年後、AIについて話題にすることはなくなるかもしれません。なぜなら、それはAIが今日の水や電気と同じで、回路全体や送電網がどのように機能するかを考えることなく、携帯電話を充電したり、家電を使用したりするときにコンセントを使うのと同様の感覚になりうるものだからです。 将来的にAI は、AI の専門家でなくても、誰でも利用できるほど低コストになるところまで到達するでしょう。 

AIは、これまで付加価値のあるサービスとして扱われてきました。したがって、産業への影響について話すとき、AIは多くの新しい可能性を開くと私たちは考えています。たとえば、タンパク質フォールディング、消費者の理解の深化、そして科学実験など、AIは科学探求の方法を変えています。そのため、AIは研究でもユーティリティとして機能することができます。特に、GPTや大規模言語モデルによってもたらされる機会は限りなく多いと私たちは考えています。私たちが行っているインフルエンサーの検索でも、キーワード検索から自然言語の検索へと進んでいます。ChatGPTが示すように、人間が自然な方法でコンピュータとやり取りできるようになると、AIはソフトウェア業界に革命をもたらすことができます。したがって、自然言語検索が今後ますます発展することが予測されます。

司会:盧諭緯氏(Lu Yu-Wei)

Segaはインターネットが誕生した後、その時代の流れに乗って創業したわけですが、技術に投資することは困難も伴うと思います。私自身も多くの転機を経験してきましたが、今後の新しいスタートアップに参入、投資したいと考えている人のために、どのようなアドバイスをお持ちですか?また、AIを用いた未来の起業についてのご意見もお聞かせください。

iKala 共同創設者兼 CEO:程世嘉(Sega)

ジェネレーティブAI(生成AI)について、私が唯一提言したいのは、ジェネレーティブAIの会社を立ち上げないことです。起業の成功率が非常に低いことは言うまでもなく、5年以内に90%の企業が倒産しており、これはシリコンバレーでも同様です。話を戻すと、私たちが最初に話したように、AI自体にはコンテクストが非常に重要です。そのため、OpenAIにはより広く、深い堀が必要になると思います。なぜなら、現在 GitHubで大量の言語モデルが簡単に見つかるため、誰でも自分の「テキスト生成、画像生成」アプリを低コストで展開することができるからです。

実際、私たちは2018年にAIを活用した MarTechをいくつかの企業に提供していました。当時、私たちは Picaas と呼ばれる機能を開発しました。これは、AI を使用して画像の背景のものを取り除き、隙間を埋めて、きれいなまるでもともとそうであったかのような画像を作成するものです。この機能は、Google Photos で Magic Eraser として表示されるようになりました。しかし私たちが2018年にこの機能をリリースした際に2つの問題が発生しました。まず1つ目は、技術的な観点からビジネスを拡大することは困難であること。この点から、スタートアップは技術ではなく消費者のニーズに焦点を当てる必要があることを学びました。どのようにAIを活用したいのか?どのように産業に応用するか?など AI に何をしてもらいたいかを考えなければなりません。マッキンゼー(McKinsey)によると、AI の価値の 70% は付加サービスからもたらされます。つまり、AI はまったく新しいビジネスモデルを作成するのではなく、既存のビジネスモデルを向上させるものであることがわかっており、これが私たちが直面した最初の学びでもあります。

2つ目は、倫理的(道徳的)な問題に直面したことです。背景の削除と置換機能をリリースした後、デザイン業界はこの機能が将来的に他人の画像を盗んで自分のものに変えることができる可能性があると懸念を持っていたため、当時私たちはモデル全体の再トレーニングを行いました。インターネット上には多くの有料画像データベースが存在するため、私たちは自分たちのAIをトレーニングし、それらのデータベースの画像は勝手に修正できないようにしました。これは著作権の問題を避けるためです。つまり、2018年に私たちは、ジェネレーティブAIがもたらす問題やそのビジネスモデルの懸念事項と実行可能性についてすでに経験し、対処してきました。

一方、ジェネレーティブAIが登場すると、多くの仕事が消えてしまうのではないかと心配する人も多いですが、AIが置き換えるのは仕事ではなくタスクです。つまり、AIがもたらすのは「脱構築」であり、ある仕事が突然消えるということではありません。技術の進歩に従って、一部のタスクが置き換えられていくのです。たとえば、文章の要約を作成する場合、ChatGPTは非常に適していますが、編集作業には多くの時間がかかることに気づくと思います。翻訳をした後、編集や校正作業に多くの時間を費やす必要があるからです。しかし、AIが節約するのは発想や要約、下書きの時間であり、それらをすべて合わせると、生産性は向上するのです。つまり、AIの技術を普及させ、消費者価値を創造するには、ワークフロー全体を解体し、AIがすでに解決できるタスクとそうでないタスクを見極める必要があるということです。

私たちはずっとジェネレーティブAIとソフトウェアの分野について話してきましたが、今年はGPTやMulti-model技術により、ロボット分野でも大きな飛躍が見られるでしょう。例えば李飛飛氏(Fei-Fei Li)の研究室では、ロボットが1000以上の動作を認識・実行できるようになっています。オンラインから物理的なものまで、今後数四半期で大きな進展が見られることでしょう。

またAIについて話すとき、私たちはどうやってそれが暴走しないようにするのか、という問題を考える必要があります。もしAIがナローで弱いものであれば、心配する必要はありませんが、それがユーティリティに進展した場合は、水や電気、国防のように、政府が規制することになるでしょう。したがって、AIがユーティリティになった場合、各国政府はこの技術の監視を強化することになると考えられます。