レポート・ライブラリ|株式会社アイ・ティ・アール

【R-225051_27125227071】ベクトルデータベースとは何か

作成者: 株式会社アイ・ティ・アール|May 1, 2025 12:00:00 AM

ベクトルデータベースは生成AIのビジネス利用を可能にするRAGの中核技術として注目されており、高度な類似検索を可能にする。本稿では、RDBMSとベクトルデータベースの違いを明確にするとともに、ベクトルデータベースを効果的に活用するためのポイントを解説する。

RDBMSとベクトルデータベースの違い

ベクトルデータベースは、データをベクトル化することでRDBMSよりも高度な類似検索(あいまい検索)を実現する。RDBMSでの類似検索は、SQLのLIKE文により完全一致もしくは部分一致で結果を得る。図1の例では、RDBMSの場合は、都道府県データをキーワード「東京」で検索し、部分一致した「東京都」だけが結果として得られる。一方、ベクトルデータベースでは、ベクトル化したデータ間の距離によって類似度を判定し、類似度の高い順に複数の検索結果を得ることができる。この例では、都道府県データを都県庁の所在地の緯度/経度でベクトル化することで、「東京都」だけではなく、距離が近い「埼玉県」などが結果として得られる。

図1.RDBMSとベクトルデータベースの類似検索の違い

出典:ITR

データのベクトル化は、緯度/経度のような数値データを用いるだけでなく、単語や文章の意味を数値化する埋め込み(エンベディング)と呼ばれる処理が行われる。埋め込み処理の実行には、Word2Vecのように公開されているソフトウェアや、OpenAIのEmbedding APIのようなクラウドサービスとして提供されている機能が利用される。