ITR Review
要求水準に適したモデル拡張の手段とは
生成AIサービスのビジネス利用において、RAG(Retrieval-Augmented Generation:検索拡張生成)が注目を集める昨今だが、社内データによってAIモデルを拡張し、期待どおりのパフォーマンスを得るのは決して容易なことではない。本稿では、組織が生成AIに求めるクエリ・レベルの観点から、適正なシステム構築アプローチを解説する。
生成AIのビジネス活用において、事前学習が施されたパブリックの基盤モデル(LLMなど)に対して、事前学習の範囲を超えた独自データを反映してその能力を拡張する有力な手段として、RAGが注目を集めていることは、以前にも紹介した(ITR Review『RAGの特徴と実装アプローチ』R-224105)。しかしながら、ここにきて、実際にRAG環境の構築に取り組む企業の担当者からは、「当初見込んだほどの精度が達成できない」との声を耳にする。
もっとも、RAG環境のパフォーマンスには、拡張に用いるデータセットの品質や鮮度、検索性能、LLMの性能といった複数の要素が反映されるため、一朝一夕で希望どおりのシステムが完成するわけではないが、それ以前に、今日の生成AIにおいて、あらゆる要件を満たす万能のソリューションは存在しないということを理解しておく必要がある。特に注意を払うべきは、生成AIサービスに対して行おうとしている質問(クエリ)のレベルを見極めることである。クエリが複雑になれば、シンプルなRAG構成では足りず、膨大なデータセットや特殊なテクニックが必要になる。RAG環境に対して不満を抱く企業の多くは、要件となるクエリ・レベルと解決策であるシステム構成との間で整合性が十分に取れていない可能性がある。
独自データを使って生成AIモデルの拡張を検討する際には、現場が求めるクエリ・レベルを正しく把握するとともに、その妥当性と、要件に見合った適正なモデル拡張手段の選定を行うことが求められる。
ITRでは著作物の利用に関してガイドラインを設けています。 ITRの著作物を「社外利用」される場合は、一部のコンテンツを除き、事前にITRの利用許諾が必要となります。 コンテンツごとに利用条件や出典の記載方法が異なりますので、詳細および申請については『ITR著作物の引用ポリシー』をご確認ください。
このサイトではJavaScriptを使用しています
ご利用になる場合は、ブラウザの設定でJavaScriptを有効にして下さい