2022年12月号
「創造するAI」」
Delta Pacific Partners 川口 洋二氏がお届けするシリコンバレーレポート。
今号はネクストトレンドとして注目される「ジェネレーティブAI(生成AI)」を紹介しています。
2023年のトレンドとして注目される「ジェネレーティブAI」
動画からコピーライティングまで、AIでコンテンツ作成が可能に
ジェネレーティブAIを使えば、静止画、動画、音声のマルチメディアコンテンツの合成ができる。コピーライティングも生成でき、マーケティングのコンテンツや広告を素早く作成できるようになる。
会話形式でやり取りできるので、Web2型のグーグル検索を置き換える可能性もある。自然言語からソフトウェアのアプリケーションも作成できる。製品開発では、製品の3Dモデルなどを生成してくれる可能性がある。
グーグルをはじめ多くの企業が参入
OpenAI社は、ジェネレーティブAIで注目を浴びるシリコンバレー拠点のスタートアップである。元Yコンビネーターのトップのサム・アルトマン、イーロンマスク等が2015年に創業。2019年にはマイクロソフトから1,300億円以上の支援を受けると発表した。
そして、2021年後半に短いテキストから画像を生成するDALL-Eを発表、2022 年 4 月にはDALL-E 2をリリースした。ジェネレーティブAIの本命と思われるグーグルも 5 月にImagen と Parti というテキストから画像の生成モデルを発表した。
その後、テキストから芸術的な画像へ変換してくれるAIモデルである Midjourney が登場し、誰もが簡単に使えることで話題となった。
8 月には、英国のスタートアップ Stability AI がStable Diffusion をオープンソースで無料公開。有料サービスの Dream Studio を介して Stable Diffusion を使い始めた利用者は一ヶ月余りで100 万人以上に達した。
10月にはグーグルやメタがテキストから動画の生成モデルを発表した。
短いビデオクリップ、アニメーション、および 3D 画像を作成できる。
宿題もお任せ!?様々なタイプのジェネレーティブAIが登場
最近では、11月末にOpen AI社が対話型AIのChatGPTを無料でプレビュー公開し、1週間足らずで100万人以上のユーザーが利用、大きな反響を呼んでいる。
ChatGPTは例えば歴史上の人物について質問すればウィキペディアのような答えを返してくれ、会話型で質問を繰り返し、情報を掘り下げることもできる。
Googleで1時間かかるような検索が数分で解決した、という評価もある。友人へのクリスマスプレゼントに何がいいかといった質問に細かなレコメンデーションもくれる。数学の宿題も解いてくれるし、国語の課題である小論文も書いてくれる。
小論文に関しては、中学校レベルでは使われている単語が難解すぎて自分でやっていないことがバレるそうだが、高校のハイレベルのクラスではAIが書いた小論文は合格レベルに達しているようである。
11月にはAIによるマジックアバター作成スマホアプリのLensaがソーシャルメディアで話題になり、12月にアップルの米国のアプストアのチャートでトップに躍り出た。
Lensaを使えばソーシャルメディアやデーティングアプリで自分の写真をアーチストが描いたアニメのヒーローのようなクールなアバターに修正できる。
一方、Lensaが広く使われるにつれ、生成される画像の露出度が高かったり、人種の特徴を取り除いてしまったりといった問題も指摘されている。
Lensaが使っているジェネレーティブAIモデルのStable Diffusionが、インターネット上の膨大な量のデータをフィルタリングせずに使ってトレーニングされており、意識的に表現バイアスをかけていないためこのような結果になってしまったようである。
図3. Lensaにより生成されたアバター (ソース:Lensaアプリ)
コンテンツ作成を効率化する新たなビジネスモデルも
ジェネレーティブAIを活用した新しいビジネスモデルのスタートアップも生まれてきた。
PromptBase社は、ジェネレーティブAIの利用者がプロンプト(コンテンツを生成するための短い命令文/呪文)をマーケットプレイスに投稿し、売買できる場を提供している。
同社のマーケットプレイスで人気のあるプロンプトには、ロゴの生成、絵文字作成、家具のデザイン、建築のデザインに関するものが見受けられる。
製薬会社がAIを使って新薬の候補を生み出すのと同じように、デザイナーが新しいアイデアを生み出す過程でPromptBaseを利用できそうである。
2020年に創業したRegie社はブランド向けの営業マーケティングのキャッチコピーを生成してくれるサービスを開発し、今年9月に約13億円の資金を調達した。
OpenAIのGPT-3 テキスト生成システムをベースに、3500万通の営業メールをモデルに再トレーニングし、ニッチな機能で独占的な優位性を獲得しつつある。
検索エンジン用に最適化されたオリジナルのコンテンツ作成や、ソーシャルメディア・ブログ向けのパーソナライズされたメッセージの作成、営業メールの品質分析等ができる。電子メール、ソーシャルメディア、携帯テキスト、ポッドキャスト、オンライン広告などの複数のチャネル間でコンテンツを標準化できる。AT&Tなどが同社のサービスを使っている。
ジェネレーティブAIの問題点とは?
様々な可能性のあるジェネレーティブAIであるが、モデルをトレーニングするのに巨大な資金が必要となる。
Stability AIは同社のモデルをトレーニングするために、AWS上でNvidia A100 GPUのクラスタを使い、約65億円を費やしたようである。
また、素人目には正解に見えて実は間違った答えを出す問題や、性別・人種バイアスやプライバシーの問題も指摘されている。
我々も意識しないまま、AIが作ったコンテンツを人が作ったものと思い込んで既に目にしている可能性もある。(ちなみに、この文章は私が作りました。)
では、皆様、良い年末年始をお過ごしください。
(以上)
年の瀬も近づき、ベンチャー業界では来年の注目トレンドについて様々な予測を耳にするようになったが、多くのベンチャー投資家が口にするのが「ジェネレーティブAI(生成AI)」である。
ジェネレーティブAIは、ユーザーが入力した内容からコンテンツを創り出すクリエイティブなAIである。大学生が宿題に出たコンピュータ・プログラムをジェネレーティブAIにコーディングさせたり、最近ではAIが作った絵画や動画が話題になっている。クリエーターやスタートアップの中には、ジェネレーティブAIを仕事や実用的な用途に活用し始めたようである。
来年は、ジェネレーティブAIに取り組むIT企業やスタートアップが人々の働き方を変え生産性を向上させる、といった予測や、既存の企業向けソフトウェアのほとんどが全ての分野で変更を余儀なくされる、といった予測が聞かれる。
図1、2は、「きらぼし銀行」というお題でジェネレーティブAIに絵を描いてもらった例である(図1ではDALL-E2、図2はStable Diffusionを使用)。
図1. 「きらぼし銀行」 DALL-E2 Demo作
図2. 「きらぼし銀行」 Stable Diffusion 2.1 Demo作