最新の記事はこちらから

テキスト生成AI

文章最終更新日:2023年11月06日

トレンド概要

大規模言語モデルを用いたテキスト生成AIの進化で、デスクワーク全般に大きな変化の兆し

データから学習し、オリジナルのテキストや画像を生み出す自動生成AI(Generative AI)が、急速に発展している。特にテキスト生成では、OpenAI(USA)が2022年11月に公開したChatGPTが、問いかけに対する受け答えの自然さと、知りたい情報を直接回答する利便性で話題となり、わずか2か月で1億ユーザに到達した。ChatGPTの登場で、ビッグテック各社も、これまでは研究開発段階だった技術やサービスのベータ版提供を急に始めるなど、動きが慌ただしい。

背景には、後述する大規模言語モデル(LLM:Large Language Model)と呼ばれる、大量のデータで学習した汎用的なAIモデルの実現がある。LLMの汎用かつ急速な進化によって、テキスト生成AIはデスクワーク全般を支援できるようになった。一方で、急激かつ巨大な変化ゆえに、潜在的なリスクも急速に意識されはじめている。2023年5月のG7広島サミットでは「広島AIプロセス」が立ち上げられ、同年7月には国連安全保障理事会でもそのリスクと報酬について議論されている。

本トレンドでは、GPTなどのLLMを用いたテキスト生成AIを中心に扱う。そしてその進化に伴う変化、例えばこれまでの検索ツールなどとの違い、プログラミングなども含めたデスクワーク全般への影響、規制・リスクなどの動向、関係する企業・サービスの関係などを概観する。

なお、ChatGPTを使って具体的に何ができるのかについては、オリジナル特集レポート「ChatGPTはレポートを書けるのか?アナリストが試してみた」、画像や動画の生成については「画像生成AI」も参照いただきたい。

LLMは、大量のテキストデータで学習した汎用的なAIモデル

テキスト生成AIを含む自動生成AIは、LLMの誕生で爆発的に進化した。

AI関連技術は、特にディープラーニングの誕生で、2010年代に大きく進化した。そして、2017年にGoogle(USA)の研究チームが「Attention is All You Need」という論文で、Self-Attention(自己注意機構)を持つTransformerという手法を発表した。この手法は、これまで使われていたRNN(回帰型ニューラルネットワーク)より学習効率が圧倒的に高く、大量のデータを学習できるようになった。

テキスト生成AIに関わる技術イメージ

出所:Uzabase作成

注1:青枠は本トレンドで主に扱う範囲

注2:画像生成AIについてはトレンド「画像生成AI」参照

学習量の増加は、AIの能力を測る指標の一つであるパラメータ数の指数関数的増加をもたらした。実際に、GPT-1は1億、GPT-2は15億、GPT-3は1,750億(変数)とパラメータ数が急増している。AIの能力はパラメータ数、学習データ量、学習に使用する計算量に応じて向上するという「Scaling Law(スケーリング則)」があるとされ、大量のデータを学習できるようになったことで、汎用的な能力をもつLLMが萌芽した。

LLMのパラメータ数の変化

出所:松尾研究室「AIの進化と日本の戦略」よりUzabase作成

そしてLLMは、少量のデータを用いた微調整(ファインチューニング)により、特定用途に最適化することもできる。例えば、ChatGPTはLLMであるGPT-3(GPT-3.5)に、人間が教師データ(ラベル)をつけることでファインチューニングした後に、無害で有用な情報を人間が好む形で出力するように人間のフィードバックに基づいた最適化(RLHF:Reinforcement Learning from Human Feedback)をしている。

なお、LLMは汎用的であるために、他のAIモデルの基盤としても使えることから、基盤モデル(Foundation Model)とも呼ばれている。

LLMとファインチューニングのイメージ

出所:Uzabase作成

自然言語での指示と対応できるタスクの幅広さで、デスクワーク全般を支援可能に

テキスト生成AIは、仕事の指示方法と、対応できるタスクの幅広さの2点で、従来のAIよりできることが増えている。

まず、複数のタスクを組み合わせた仕事の指示が、人間同士でコミュニケーションするような普通の文章(自然言語)でできるようになった。これまでは、例えばGoogleでキーワード検索を行い、さらには内容を確認して人間がまとめたり、まとめるサービスを使ったり、というように順番に個別に行う必要があった。それが、例えばMicrosoft(USA)のBingやGoogleのBardなどのテキスト生成AIを使った会話型検索では、調査テーマとまとめ方を入力すれば、要約までやってくれる。少ない指示で工程の多くをできることから、効率が大きく改善する。

そして、LLMによって汎用的な能力・知識を獲得しているため、追加的な開発をせずとも対応できるタスクの種類がそもそも幅広い。多くのデスクワークは何らかのテキストを使った業務であり、それに幅広く対応できる。

なお、テキスト生成AIによるアシストは、人間が行ってきた仕事を完全に代替するのではなく、その作業の一部を補佐・代行するものであるため、Copilot(副操縦士)とも呼ばれている。

従来のAIとテキスト生成AIへの仕事の指示の違い

出所:Uzabase作成

従来のAIとテキスト生成AIが可能なタスクと主なサービス

出所:Uzabase作成

サービス開発や利用時の主なリスクは、著作権、情報流出、誤情報発信の3つ

テキスト生成AIは黎明期にあるため、具体的な規制や事例はまだ十分にはない。しかし、サービス開発時および利用時の主なリスクとして、著作権、情報流出、誤情報発信が挙げられ、AI開発推進とのバランスも考慮されながら議論が行われている。

著作権については、学習データへの著作物利用はおおむね認められているが、学習済モデルによる営利目的のサービス拡大に伴い、著作権者からの訴訟や異論が出てきている。2022年11月に、プログラムコードの補完サービスである「GitHub Copilot」に対し、オープンソースコードを不適切に収益化したとして、開発したMicrosoft、GitHub(USA)、OpenAIに対して訴訟が提起された。また、米日の新聞・メディアの業界団体は、著作物の学習データ利用が許容されている現状について、懸念や異論を表明している。

情報流出については、非公開情報を入力した際の情報漏洩が懸念されており、既にChatGPTなどの利用を禁止している企業もある。2023年3月にはイタリアがEUの一般データ保護規則(GDPR)の順守確認のため、一時的にChatGPTをブロックした。同年4月には、個人情報の収集と使用の方法の明示やユーザ年齢認証ツールの提供など対応したことで解除されている。

誤情報発信リスクについては、AIが生成した内容をそのまま発信、あるいはチェックをすり抜けてしまうことが懸念されている。テキスト生成AIは仕組み上、誤った回答が出力される可能性がある。この現象は「ハルシネーション:hallucination、幻覚」と呼ばれており、生成した文中に紛れ込むためチェック時に気づきにくい。

テキスト生成AIの主なリスクとその概況・事例

出所:Uzabase作成

中国は暫定規制を発効、EUは2023年内合意見込み、G7として同年内に見解がまとまる見込み

生成AIの急速な展開に対応するため、各国で対応方針や規制の議論が進められている。

主な論点は、前述のリスクの内、著作権と誤情報発信(特にフェイクコンテンツ)に関する内容である。

既に、中国は2023年8月に暫定処置として施行している。ここでは、AI生成物が「社会主義の中核的価値観を反映していること」を要求するという、欧米や日本では見られない規定が含まれている。一方、日米欧は、2023年5月のG7広島サミットにおいて「広島AIプロセス」が立ち上げられ、著作権保護やフェイクコンテンツ対策などへの見解をまとめることに合意している。特に、EUは同年6月に「AI規制案」を採択しており、年内合意をめざしている。

なお、規制動向の詳細については「ChatGPT規制、今見るべきポイント(2023年7月)」も参照いただきたい。

生成AIに関する規制動向

出所:Uzabase作成

注:規制動向については「ChatGPT規制、今見るべきポイント(2023年7月)」も参照

マネタイズ

自動生成AI市場は2022-30年にCAGR35%で成長見込み、さらなる期待も

テキスト生成AIを含む自動生成AI全体の市場規模は、Grand View Researchが2023年1月に発表した調査では2021年で80億ドル、2030年には1,094億ドルとなりCAGR約35%で成長すると予想している。2021年時点の技術別の内訳では、テキスト生成AIを含むTransformerセグメントが最大の収益シェアを占めており、用途別では、メディアとエンターティメントが最も収益が大きく、特に広告作成への採用増加にともない今後も成長が見込まれている。

ただし、ChatGPTが発表されたのは2022年11月末だ。その後、ChatGPTを応用した新しいサービスやアイデア、ChatGPT自体のAPIでの提供やGPT-4の発表、ビッグテック各社の急速な注力など、環境は大きく変化している。実際に、Googleは自社検索サービスの根幹を脅かす可能性があるとして経営として社内に警戒を呼びかける「Code Red」を発動した。現在の期待値は、この調査よりも高い可能性もあるだろう。

世界の自動生成AI市場規模

出所:Grand View Research公表の数値を基にUzabase作成

注:数値表記がない年はデータ非公表

プログラム用途では開発時間が半分以下、広告用途では3割削減を目指す事例も

プログラミングの編集・記述支援サービスである「GitHub Copilot」では、プログラム作成にかかる時間が55%短縮されたとの調査結果が出ている。プログラミングは、日常生活にインターネットが溶け込み、世界がデジタル化する中で、雇用含めたニーズが広がっている領域だ。それゆえ雇用需給もタイトであり、人件費も高騰している。その対応として、雇用を増やさずにプログラミングの生産性を上げられれば、十分な費用対効果につながる可能性がある。

また、サイバーエージェントはChatGPTを活用してデジタル広告のオペレーションにかかる時間の3割減(約7万時間削減)を目指すと2023年4月に発表している。

先進国では特にデスクワーク中心の業務の従事者が多い。実際に労働力統計(2021年)によると、日米ともに労働者の6割前後が管理職や専門職、事務職などデスクワーク中心の職業についている。デスクワークは、なんらかのテキスト入力を伴う業務が多く、潜在的な市場規模も大きいだろう。OpenAIとペンシルべニア大学の調査では、GPTの導入により米国労働者の約80%が少なくとも10%の仕事内容に影響を受けるとされている。

インターネットやメール、Web会議の登場によって働き方が変わったように、活用によって働き方や生産性も変わっていく可能性が高いだろう。

 GitHub Copilotによるプログラム作成の時短効果

出所:GitHub「Research: quantifying GitHub Copilot’s impact on developer productivity and happiness」を基にUzabase作成

未来

関連する企業・サービスは、LLM自体の開発とそれを用いたサービスの階層で捉える

LLMやテキスト生成AIに関わる企業やサービスは、開発観点と利用観点で分けて構造を捕らえていくと分かりやすい。

まずLLM自体の開発がある。これらは、ビッグテック各社が自社で取り組んだり出資をしたりしながら進めていることが多い。OpenAIは、Microsoftから2019年以降、数十億ドルの投資を受けて提携している。Googleは自社で多くのLLMを開発しているほか、子会社にDeepMind(GBR)を持ち、また、GPT-3を開発したメンバーらが創業したAnthropic(USA)にも出資している。2023年2月にはAmazon.com(USA)がHugging Face(USA)との提携を拡大し、AWS上で次世代版の言語モデルを構築するとしている。Apple(USA)もiPhoneなどへの2024年後半実装に向けて開発中との報道もある。LLM周辺技術が急速に進化しており、ビッグテックとしても手掛けないわけにはいかない領域であり、またスタートアップ側も大規模なデータ学習に資金や計算リソースも必要であることがこれらの提携の背景にあるだろう。

そして、このLLMを利用してChatGPTなどのテキスト生成AIサービスが作られる。他に、ChatGPTなどの比較的汎用性が高いテキスト生成AIサービスのAPIにつなげることで、テキスト生成AIを組み込んだ別のサービスも開発されている。

ユーザが利用するのは、これらのサービス部分だ。利用はそのまま利用できるサービスもあれば、データ読み込みや小規模な開発によって自社に最適化したうえで使う場合もある。

LLMの利用と開発に関する企業・LLM・サービス

出所:Uzabase作成

注:法務用サービスについてはトレンド「リーガルテック」も参照

デスクワーク全般に向けたサービスや、特定用途に最適化可能なサービスが登場

デスクワーク全般の生産性向上を目的としたテキスト生成AIサービスは、ビックテック各社がサービス提供を開始、もしくは開始しようとしている。また有料無料問わず、様々なサービスが登場し始めており、今後も拡大していくだろう。

2022年11月にOpenAIがChatGPTを基本無料のサービスとして公開した。2023年2月にはMicrosoftがGPT-4を同社の検索エンジンである「Bing」に利用、同社のブラウザである「Edge」で提供を始めている。また、同年9月には「Microsoft Copilot」を発表しWindows11に標準搭載したほか、同年11月には企業向けにオフィスソフト「Microsoft 365 Copilot」の提供を開始した。Googleも、一部のユーザ向けにGoogle検索に生成AI機能「Google Search Lab」を提供するほか、オフィスソフトなどへの導入を進めると発表している。ほかにも、GitHubが前述の「GitHub Copilot」、Notion(USA)が文書生成や校正、議事録作成などをアシストする「Notion AI」、Zoom(USA)はOpenAIと提携しミーティング内容の要約などを行う「Zoom IQ」をリリースしている。

また特定用途向けでは、自社のデータで最適化するサービスが増えている。Salesforce(USA)の「Einstein GPT」は顧客データをリアルタイムで学習し、パーソナライズされたメール案文や質問応答を生成できる。Writer(USA)は、自社のデータを利用してテキスト生成AIをトレーニングし、自社ブランドに合わせたメール、SNS、ブログの文体を作成できる。

無料・有料問わず、自社の情報をサービス提供に入力するため、情報セキュリティの観点は必要となるだろう。特にサービスを無料で利用する場合には、入力した情報がAI学習のデータとして使用することが利用規約として含まれることや、その情報の第三者への機密情報流出のリスクもある。生産性改善と情報セキュリティニーズの両面を考慮しながら、有料サービスを含めた検討が必要だろう。

LLMを用いたサービス開発は、API、クラウド、自社環境で利用する方法がある

LLMを用いたテキスト生成AIサービスを開発する方法には、APIを利用する方法がまず挙げられる。加えて、直接LLMを利用する方法として、クラウドサービスで提供されるLLMを利用する方法と、公開されているLLMを自社環境で構築して利用する方法がある。

APIを使用する場合は、わずかなコードを記述するだけでLLMをサービスに導入できる。OpenAIやAI21 Labs(ISR)は自社LLMのAPIを提供しており、Hugging Faceは8万を超える一般公開されたモデル(音声、画像含)を利用できる。いずれもファインチューニングが可能であるため、自社データを用いて、特定用途向けのサービスを開発できる。

またChatGPTも、APIでの接続に加え、2023年3月にはプラグインでサービスと直接接続する方法を発表した。プラグインは、現段階ではExpedia(USA)など数社での提供になっているが、自社サービスにあるデータと組み合わせたチャットボットとして機能させることができる。

クラウドサービスの場合は、Microsoft、Google、AWS(USA)などが提供しているクラウドサービス上で利用可能なLLMを使用して開発する形だ。また、公開されているLLMを自社環境で使用する場合は、LLMモデルをHugging Faceなどから取得し、自社で用意したサーバ上で開発する。

どの方法で開発するかは、サービス開発の容易さや導入スピード、情報セキュリティの観点、運用コストなどが考慮点となるだろう。

APIを提供している主な企業とモデル

出所:Uzabase作成

青山 武史

青山 武史

グロービス経営大学院大学でMBAを取得し、キャリアを一貫してクリエイティブ、テクノロジー、ビジネスを高度に融合させた新規事業開発やイノベーションの創出を主導して来た。スタートアップ(最高事業責任者)や事業会社(マーケティング最高責任者)等でマーケティングからサービス開発までの新規事業開発の経験を積み、多くの事業で収益規模を拡大し、大手企業とのアライアンスに携わった。現在はYKK APにて新規事業開発部担当部長として、再生エネルギー事業の推進と新規領域の探索を担当。Point0を通して大手企業と共創活動を推進。渋谷未来デザインとSWiTCHとのカーボンニュートラルプロジェクト「CNUD」に参画。個人としても大手エネルギー企業のヘルスケ領域の新規事業開発支援コンサルティング実績多数。

コメント

この記事へのコメントはありません。

CAPTCHA


関連記事