このサイトではJavaScriptを使用しています
ご利用になる場合は、ブラウザの設定でJavaScriptを有効にして下さい
ITR Review
RDBMSとの違いと活用指針
時系列データベースは、タイムスタンプ(時刻情報)を持つデータを扱うことに特化したデータベースであり、時系列に沿ったデータを効率的に操作・管理でき、リアルタイムでのデータの読み書きが可能なことから、最近ではIoTデータの解析に適したデータベースとして注目されている。本稿では、RDBMSと時系列データベースの違いを明確にするとともに、時系列データベースを効果的に活用するためのポイントを解説する。
まずは、代表的な時系列データベースであるInfluxDBを例に、RDBMSと時系列データベースの違いを解説する。RDBMSでいうところのテーブルとレコードは、時系列データベースではそれぞれMeasurementとPointと呼ばれる。RDBMSのカラムに相当する列は、時系列データベースでは、タイムスタンプが格納されるTime、検索キーとなるTag、実際のデータが格納されるFieldの3種類がある。Time列は全てのPointに存在する必要があるが、TagとFieldは全てのPointで共通である必要はない(図1)。
時系列データベースでは、基本的にデータの更新は行われない。その理由を、センサーのようなIoTデバイスで発生するデータを例に考えてみると、発生したデータを時系列に蓄積したあとに、それらのデータを遡って変更する必要性自体が極めて少ないからである。また、データの削除についても、古くなったデータを期間を指定してまとめて削除することはあっても、特定のデータを厳密に指定して削除する必要性はほとんどない。
以上のような背景から、時系列データベースにはデータを更新(UPDATE)する機能はない。また、データをPoint単位で削除する(DELETE)機能もなく、データ保持期間を設定することによって期間を過ぎたデータを一括削除することしかできない。時系列データベースは、データの書き込みと読み込みに特化することで、RDBMSよりも高いパフォーマンスとスケーラビリティを実現している。
ITRでは著作物の利用に関してガイドラインを設けています。 ITRの著作物を「社外利用」される場合は、一部のコンテンツを除き、事前にITRの利用許諾が必要となります。 コンテンツごとに利用条件や出典の記載方法が異なりますので、詳細および申請については『ITR著作物の引用ポリシー』をご確認ください。