変化の激しい現代のビジネス環境では、社内外の多様なデータをリアルタイムで連携・活用する「動的なデータ連携」が競争力の鍵を握る。本稿では、そうした要件を満たす設計思想として注目される「データファブリック」について、その定義と構成要素、導入時に留意すべき設計・運用上の課題を考察する。
求められる動的なデータ連携
現代のビジネス環境は、かつてないスピードで変化している。企業は、顧客ニーズや取引先の状況、社会的・経済的な動向といった外部要因に加え、商品やサービス、それに伴う人員や設備リソース変更といった内部要因にも、迅速かつ頻繁に対応する必要がある。こうした複雑かつ不確実性の高い環境下で的確な意思決定を行うには、これらの情報をリアルタイムで把握する仕組みが不可欠である。
これまでも企業では、多くの業務においてデータ活用の取り組みが行われてきた。さらにデータを動的に連携させることによって、より多くのユースケースで効果を高めることが期待できる(図1)。
出典:ITR
しかし多くの場合、部門ごとに構築された業務アプリケーションがサイロ化しており、横断的なデータ収集や分析を阻む構造的課題を抱えている。その結果、必要な情報がタイムリーに取得できず、意思決定のスピードや品質が低下する問題が生じている。また、これまでデータ連携基盤に用いられてきたETLは、日次や週次といったバッチ処理を前提としており、リアルタイムでの活用には不向きである。さらにデータレイクのように多様なデータを一元的に蓄積するデータ基盤も登場しているが、データ間の関係性の発見や仮説形成まで活用できている企業は限定的と思われる。
企業が「データドリブン」な意思決定を実現するには、「動的なデータ活用」のための新たなプラットフォームの登場が求められる。そして、その課題に対して大きな追い風となったのが、AI技術の急速な進展である。AIは、膨大なデータから有用な特徴量を抽出し、将来予測や異常検知を支援することで、データ活用の高度化を促進している。
また、動的なデータ連携を実現するための重要な概念として近年注目されているのが、「データファブリック」である。これは、社内外に散在する多種多様なデータソースを、論理的かつ意味づけによって結びつけて、状況に応じて柔軟に活用できるようにする、という設計思想である。しかし、“データファブリックシステム”のような製品・サービスは現時点では存在せず、アーキテクチャのあり方を示すものである。一方で、AIの進展によって、データの収集・解釈・予測のプロセスが自動化の動きを加速しており、このAIの本格活用がデータファブリックの概念の具現化を後押しするとみている。