1. TOP
  2. レポート・ライブラリ
  3. ベクトルデータベースとは何か - RDBMSとの違いと活用指針 -


ITR Review

コンテンツ番号:
R-225051
発刊日:
2025年5月1日

ベクトルデータベースとは何か

RDBMSとの違いと活用指針

著者名:
平井 明夫
ベクトルデータベースとは何かのロゴ画像

ベクトルデータベースは生成AIのビジネス利用を可能にするRAGの中核技術として注目されており、高度な類似検索を可能にする。本稿では、RDBMSとベクトルデータベースの違いを明確にするとともに、ベクトルデータベースを効果的に活用するためのポイントを解説する。

RDBMSとベクトルデータベースの違い

ベクトルデータベースは、データをベクトル化することでRDBMSよりも高度な類似検索(あいまい検索)を実現する。RDBMSでの類似検索は、SQLのLIKE文により完全一致もしくは部分一致で結果を得る。図1の例では、RDBMSの場合は、都道府県データをキーワード「東京」で検索し、部分一致した「東京都」だけが結果として得られる。一方、ベクトルデータベースでは、ベクトル化したデータ間の距離によって類似度を判定し、類似度の高い順に複数の検索結果を得ることができる。この例では、都道府県データを都県庁の所在地の緯度/経度でベクトル化することで、「東京都」だけではなく、距離が近い「埼玉県」などが結果として得られる。

図1.RDBMSとベクトルデータベースの類似検索の違い

図1.RDBMSとベクトルデータベースの類似検索の違い
出典:ITR

データのベクトル化は、緯度/経度のような数値データを用いるだけでなく、単語や文章の意味を数値化する埋め込み(エンベディング)と呼ばれる処理が行われる。埋め込み処理の実行には、Word2Vecのように公開されているソフトウェアや、OpenAIのEmbedding APIのようなクラウドサービスとして提供されている機能が利用される。

ITR 著作物の引用について

ITRでは著作物の利用に関してガイドラインを設けています。 ITRの著作物を「社外利用」される場合は、一部のコンテンツを除き、事前にITRの利用許諾が必要となります。 コンテンツごとに利用条件や出典の記載方法が異なりますので、詳細および申請については『ITR著作物の引用ポリシー』をご確認ください。

TOP