1. TOP
  2. レポート・ライブラリ
  3. 次世代の生成AIソリューション


ITR Insight

コンテンツ番号:
I-323103
発刊日:
2023年10月5日

次世代の生成AIソリューション

著者名:
マーク アインシュタイン / Marc Einstein
次世代の生成AIソリューションのロゴ画像
生成AIとはどのようなものか
企業のDX推進に生成AIはどのように活用できるか
企業が注意すべきリスクと潜在的なメリットは何か

ChatGPTなどの生成可能な事前学習済み言語モデルがリリースされ、IT社会を席巻したことで、AIはこれまで以上に重要なテーマとなっている。自動化や機能向上にとどまらず、オーディオ、画像、動画などのクリエイティブな領域へ活用の幅を広げるなか、AI技術は、いくつかの課題を乗り越え、企業のDXに多大な恩恵をもたらすようになると見られる。

生成AIのスコープ

生成AIのスコープ

本稿では、生成AIを「プロンプトに応答してテキスト、画像、または他のメディアを生成することができるAIシステムの一種」と定義する。これらのシステムは、LLM(大規模言語モデル:コンテンツを人間のように理解および生成する訓練済みの深層学習モデル)に代表されるあらかじめ訓練された基盤モデルを利用し、コンテンツを生成する。

伝統的なAIは、データの生成ではなく分類に重点を置いており、生成AIはこの点で伝統的なAIと異なる。例えば、伝統的なAIでは、画像認識の独自モデルを構築して日本語や英語などの言語を特定するが、生成AIは訓練済みのLLMを利用して日本語や英語のコンテンツを認識し作成できる。これは両者の重要な違いである。

本稿では、テキストベースのモデルや生成物にとどまらない生成AIのスコープに焦点をあてる。それには、おおまかにオーディオ、画像と動画、合成データの3つの分野があげられる。ChatGPTなどのテキストベースのソリューションについては、ITRが発行している他のレポートを参照されたい。本稿では、テキスト以外の分野に重点を置き、これを次世代の生成AIと位置づけて、事例を交えながら技術動向を述べる。

ITR 著作物の引用について

ITRでは著作物の利用に関してガイドラインを設けています。 ITRの著作物を「社外利用」される場合は、一部のコンテンツを除き、事前にITRの利用許諾が必要となります。 コンテンツごとに利用条件や出典の記載方法が異なりますので、詳細および申請については『ITR著作物の引用ポリシー』をご確認ください。

TOP