最新の記事はこちらから

画像生成AI

文章最終更新日:2023年09月28日

トレンド概要

画像・動画を生み出すAIは、効率化に加え、大衆にコンテンツ制作の機会を提供する

2022年にOpenAI(USA)が「DALL・E2」を発表して以降、画像生成AIが相次いで登場し、短期間のうちに人間が描いた作品と見分けがつかないほどまで性能が向上している。同年にはAI制作の絵画「Théâtre D’opéra Spatial」が米国のコンクールで優勝した。活用は個人利用が先行し、SNSにはAI生成画像が大量に投稿され、漫画や絵本など一部では商用化した例もみられる。ビジネス利用も、広告や動画といったコンテンツ制作の背景素材やアイデア創出で活用が始まっている。

背景には、人間同士でコミュニケーションするような普通の文章(自然言語)の入力で、思い描いた画像・動画を生み出せるようになったことがある。画像や動画などのコンテンツ制作は、これまでも編集ソフトによるデジタル化は進んでいたが、これらは今あるものに変更を加える(編集)だけのものであった。一方、生成AIでは、今ある画像・動画から別のスタイル(スタイル変更)や、テキスト入力をもとに全く新しい画像・動画を生み出す(生成)ことができる。これにより、クリエイターは大きな効率化が期待でき、また、絵を描く技術を持たない大衆にも制作機会が大きく広がり、発想さえあれば誰にでも画像・動画制作ができるようになった。

可能にしたのは、テキストエンコーダという自然言語を変換する技術と、拡散モデルという画像を生成するAIの組合せが実現したことにある。また、急速な普及はスタートアップ企業がAIモデルの一般提供やオープンソース化をしたことが寄与している(後述)。

従来の編集ソフトと画像・動画生成AIが可能なタスク

出所:Uzabase作成

画像・動画生成AIは自然言語から画像・動画を生み出すことができるAI

2022年に画像・動画生成AIは技術、普及の両面で大きな進展を遂げた。

技術面では、テキスト生成AIでも用いられているTransformerの手法から、入力テキストの意図を変換するテキストエンコーダ(CLIP:Contrastive Language–Image Pre-training)が登場し、変換されたデータから画像を生成することができる拡散モデル(diffusion model)との組み合わせが実現した。これによりOpenAIが2022年4月に発表したDALL・E2では、これまで主に用いられていたGAN(敵対的生成ネットワーク)という手法を用いたAIよりも、複雑な自然言語の入力を基に多様な画像の生成が可能となった。

普及面では、当初、AI開発企業はその社会的影響への懸念から公開を控えていたが、2022年8月にスタートアップのStability AI(GBR)がAIモデル「Stable Diffusion」のソースコードと学習データをオープンソースで公開した。これにより個人や企業が容易に活用可能な環境が整い、追加学習による特定用途での性能向上やAIモデルを使用したサービス開発が活発化し、普及が進んでいる。

コンテンツ制作には、表面化している効率化ニーズと潜在的な表現ニーズの2つがある

コンテンツ制作には、クリエイターによる制作効率化のニーズと、絵を描く技術がない大衆が潜在的に抱く画像・動画による表現ニーズがある。

制作効率化のニーズは、近年のコンテンツの個別化や短命化により、必要とされるコンテンツの種類・数が増えていることから生じている。コンテンツには明確な定義はないものの、ここではWeb広告やブランディングといった他の目的を果たすための手段としてのコンテンツ(マーケティング用コンテンツ)と、ユーザによるSNS投稿や映画、アニメ、漫画、研修動画などのそれ自体を見ることを目的としたコンテンツ(エンタメ用コンテンツ)に大別して述べる。

マーケ用コンテンツでは、広告やブランディング効果最大化のため、ユーザ興味に対する個別化(パーソナライズ)やA/Bテストを行っており、1つの施策に対して複数種類のコンテンツが必要となっている。また、エンタメ用コンテンツを代表するSNSでは、コンテンツ寿命は極めて短い。実際に、投稿の半減期(総エンゲージメントの半分を獲得するまでの時間) は、YouTubeでは数日、Instagramでは数十時間、Facebookでは数時間、Twitterでは数十分、TikTokでは数分といわれている。さらに、コンテンツの種類も多様で、フォロワーを維持するために新鮮なコンテンツを供給し続ける必要がある。一方、現在のコンテンツ制作はその大部分が人手で行われており、供給側のリソースは限られている。

表現ニーズは、自己の発想を画像や動画で表現したい欲求を持つ人は多い一方、それに十分な技術やそれを習得するのに必要な時間はないことから生じている。

これらに画像・動画生成AIはフィットして、大きな期待が寄せられながら、成長を始めている。

サービス開発、利用時の主なリスクは著作権とディープフェイクへの対応

画像・動画生成AIの主なリスクはテキスト生成AIに共通する部分が多い。このため、本レポートではサービス開発、利用時に重要度が高いリスクとして著作権、ディープフェイクに焦点をあてる。

著作権については、開発目的での著作物の学習データとしての利用はおおむね認められているものの、AI開発企業に対する訴訟事例が発生している。2023年2月に、Getty Images(USA)は同社の著作物を無断で学習データに利用したとしてStability AIを提訴した。また、それ以外にも米国のアーティスト3人が同様の集団訴訟を起こしている。

ディープフェイクの問題は、その対策としてAI製であることの明示が求められていくと考えられる。欧米ではAIが生成したコンテンツに対し電子的な透かしの付与や、AI製であることの明示を義務付ける方針となっている。

(ディープフェイクについてはトレンド「フェイクコンテンツ検出」、著作権の詳細は「テキスト生成AI」参照)

画像・動画生成AIの主なリスクとその概況

出所:Uzabase作成

マネタイズ

画像生成AIの市場規模はグラフィックデザイナー市場の1%未満、今後の拡大余地は大きい

Grand View Researchによると、画像生成AI市場は2023年に約3.5億ドル、2030年でも約11億ドルと予測されている。分野別ではメディア及びエンターティメント、SNSの収益シェアが大きい。

一方、IBIS Worldによると、マーケ用コンテンツやパッケージなどを含む世界のグラフィックデザイナー市場は2023年で497億ドルとなっている。2023年の画像生成AI市場は、グラフィックデザイナー市場の1%未満にすぎず、今後の市場拡大余地は大きいといえる。また、画像生成AIの用途先は、映画、アニメ、漫画、ゲームなどのエンタメ用コンテンツもあるため、実際の拡大余地はさらに大きいと考えられる。

経済性は、大量作成して個別化する効果とAI活用によるコスト削減のバランスが変数

画像生成AI導入の経済性評価を簡易的にシミュレーションする方法を、広告を例にして考える。例としてコンテンツ制作コストと広告効果をそれぞれ要素分解し、AI導入に伴う要素を加えて、そのコスト対効果を比較検討するものだ。

コンテンツ制作コストは下図のように要素分解することができ、AI導入の場合は、コンテンツあたり制作工数が効率化で削減されるほか、要素としてAI導入コストが追加される。広告効果は、コンテンツ制作コストを加味したWeb広告のクリック単価を例に考え、要素分解した。

また、各要素に前提を置いて数値を入力し、シミュレーションを行った。Web広告で同一コンテンツのみだと掲載初日以降にクリック率が半減すると仮定し、その対策として複数コンテンツを制作して、広告の個別化などでクリック率を維持することとした。この場合、変動する要素は制作数、クリック率、コンテンツあたり制作工数となる。いずれも経済性に対して乗算、除算の関係でありその影響は大きいと言える。

シミュレーション結果は前提により変化するが、制作数をどの程度増やし、どの程度の効果があればAI導入の経済性が見込めるのかの指針にはなるだろう。人手では制作コストが嵩み、かえって広告効果が悪化する場合でも、AI導入の効率化度合いが大きければ広告効果が向上することもあるだろう。一方で、個別化によるクリック率向上の効果が低い場合は、制作数を増やすよりも、人手による高品質なデザインの方が効果が高い可能性もあろう。

扱うコンテンツの種類などによって何を要素とするか、また、その要素の水準や前提をどう設定するかは異なる。ただし、同様の考え方で要素分解し、シミュレーションすることはできるだろう。

経済性シミュレーションの要素分解例と前提に基づく試算例

出所:Uzabase作成

注:青枠は試算時に異なる条件を付与した要素

未来

著作権対応の動きは、将来的にAIの性能に差を生む可能性がある

AIの性能向上のためには大量かつ多様な学習データが必要だ。このため、これまで発表されたAIモデルの多くは、オープンデータなどWeb上に公開された画像・動画を基にした学習データを用いていた。

しかし、ビジネス向けにサービスを展開する場合、サービス企業やユーザからは前述の著作権リスクへの対処が求められる。このため、ビジネス向けサービス提供企業と提携するAIモデル開発企業は、ストックフォトサービスとの提携で著作権対応をすすめている。

MicrosoftやJasper(USA)と提携しているOpenAIは、Shutterstock(USA)と提携して学習データ提供を受けている。同様に、WPP(GBR)と広告向けサービス開発を進めるNVIDIA(USA)は、Getty Imagesと提携している。ShutterstockとGetty imagesは、自社サービス上の画像・動画を基にした学習データを提供しており、学習データのもととなった画像・動画の提供者へ報酬提供を行うことで著作権リスクに対処している。また、自社サービスへの導入や、Googleと提携しているAdobe(USA)は、自社のストックフォトサービスのデータを利用してAI開発を行っている。

一方で、主に個人向けにサービスを展開している、Stability AIやMidjourneyといった企業には、学習データの取得方針に変化は見られない。

現時点で、アニメや特定のクリエイターの作風など多様な画像を生成でき、一般に性能が高いと評価されているのは、Stable diffusionやMidjourneyなどのオープンデータで学習したAIモデルである。学習データの取得方針の違いが、今後、AIの性能に差を生じさせる可能性はあるだろう。

画像・動画生成AIの開発と利用に関する主要企業

出所:Uzabase作成

ビジネス利用はコンテンツの素材準備やアイデア創出などまだ限定的

現時点でのビジネス利用は、コンテンツの素材やアイデア創出などに用途が限られているようだ。

話題となっているビジネス活用事例は、いずれもコンテンツの素材やアイデア創出を目的としたものである。マーケ用途では、2023年3月にCoca-Cola(USA)がグローバル広告「Masterpiece」にて、商品ボトルを様々な画家の作風で表現するのに使用、Nestle(CHE)は、AIを用いて名画を枠外まで拡張する過程を広告に使用した。エンタメ用途では2023年3月にNetflix(USA)が短編アニメ「The Dog & The Boy」にて、制作効率化のためにAI生成の背景画を素材として使用、The Walt Disney(USA)はDisney+の「Secret Invasion」のオープニングにてツールの一つとして生成AIを活用した。

利用が限定的である背景には、現状のAI生成物の品質がビジネスでそのまま使用できるほど高くなく、また、思い通りのものを生成することが難しいこともあるだろう。Netflixの事例では、制作会社によると、求めている背景画の構図を一度で生成することができず、入力テキストの試行錯誤や人手による加筆、修正を繰り返す必要があった。その結果、効率化の効果も背景画ごとに1割~9割と振れ幅が大きいとしている。

画像・動画生成AIの用途別活用事例

出所:Uzabase作成

活用拡大は汎用用途での個人利用がけん引するか

コンテンツ制作での活用拡大は、SNS投稿などの汎用的な用途における個人利用がけん引していくであろう。

現在の画像・動画生成AIは、マーケティングやエンタメ用途でプロのクリエイターが本格的に使うには十分とは言えないが、個人利用をする分には十分な性能を持っている。さらに、絵を描く技術がなくとも、発想さえあれば誰でもコンテンツ制作が可能になった意義は大きい。Twitter(X)やInstagramなどのSNSには、日々大量のAI生成画像が投稿されており、Twitterに投稿されたAI生成マンガ「サイバーパンク桃太郎」は、2023年3月に単行本化されている。また、YouTubeにはAIを使用した絵本の作り方が公開され、既にAmazonにはAI画像を挿絵とした絵本が多数出品されている。

加えて、個人が利用しやすい環境も整い始めている。2023年9月にはOpenAIがChatGPTから画像生成を可能にすると発表、YouTubeもショート動画向けに背景画像や動画を生成するサービスを2024年より展開すると発表している。

現在の状況は、過去に音声合成技術「VOCALOID」が登場したときと構造的な類似点が多い。音声合成技術の登場は、歌が歌えない人でもオリジナルの曲制作を可能にし、大衆に機会を提供した。そして、新しいタイプの音楽クリエイター(ボーカロイド・プロデューサー)が登場し、SNSに作品を投稿することから利用が拡大し、登場から数年後には音楽の1ジャンルにまで成長したり、そのクリエイターがボーカロイド以外にも楽曲提供をするケースも増えている。今回も同様のことが起きる可能性があるだろう。

青山 武史

青山 武史

グロービス経営大学院大学でMBAを取得し、キャリアを一貫してクリエイティブ、テクノロジー、ビジネスを高度に融合させた新規事業開発やイノベーションの創出を主導して来た。スタートアップ(最高事業責任者)や事業会社(マーケティング最高責任者)等でマーケティングからサービス開発までの新規事業開発の経験を積み、多くの事業で収益規模を拡大し、大手企業とのアライアンスに携わった。現在はYKK APにて新規事業開発部担当部長として、再生エネルギー事業の推進と新規領域の探索を担当。Point0を通して大手企業と共創活動を推進。渋谷未来デザインとSWiTCHとのカーボンニュートラルプロジェクト「CNUD」に参画。個人としても大手エネルギー企業のヘルスケ領域の新規事業開発支援コンサルティング実績多数。

コメント

この記事へのコメントはありません。

CAPTCHA


関連記事