ITR Review
外部データによるLLMの拡張
LLM(大規模言語モデル)を業務に適用するうえで、昨今極めて高い関心を集めているキーワードが「RAG(Retrieval-Augmented Generation:検索拡張生成)」である。本稿では、RAGが求められる背景とその特徴、多様化する実装アプローチについて紹介する。
生成AIサービスの大きな利点は、事前学習が施されたパブリックの基盤モデル(LLMなど)を使用することにより、ユーザー側が学習用のデータセットを用意することなく高品質なタスク処理を実現できることである。しかし、これは裏を返せば、基盤モデルが学習していない分野の情報については能力を発揮できないということでもある。現在パブリックで提供されている基盤モデルは、未学習分野のプロンプト(質問)が寄せられると、単に回答が生成できないだけでなく、存在しない情報や誤った情報を堂々と出力する「ハルシネーション(幻覚)」と呼ばれる現象を引き起こすことが知られている。
パブリックの基盤モデルが事前学習できていない情報の代表格といえば、業務マニュアルや規定集、各種ナレッジデータといった企業の内部に蓄積・保管されている固有情報である。したがって、企業の間では、これらの固有情報を反映した自社ならではの生成AIサービスを実現することに対する潜在的な需要が大きい。また、これまで社内のナレッジ探索を担ってきたエンタープライズサーチ製品も、生成AI対応への対応を急ピッチに進めており、新たな検索体験を提供し始めている(ITR Review『進化するエンタープライズサーチ』R-224104)。
ITRが2024年1月に、従業員数1,000人以上の大企業のIT担当者を対象に実施した生成AIに関するアンケート調査では、「生成AIサービスに今すぐに望む進化は何か」を問うたが、「過去に蓄積されたナレッジ・教訓を反映した厳正な回答生成能力の向上」を選択した割合が全体の約4分の1に上り、トップとなった(図1)。
ITRでは著作物の利用に関してガイドラインを設けています。 ITRの著作物を「社外利用」される場合は、一部のコンテンツを除き、事前にITRの利用許諾が必要となります。 コンテンツごとに利用条件や出典の記載方法が異なりますので、詳細および申請については『ITR著作物の引用ポリシー』をご確認ください。
このサイトではJavaScriptを使用しています
ご利用になる場合は、ブラウザの設定でJavaScriptを有効にして下さい