MarkLogicデータハブ

概要

MarkLogicデータハブは、MarkLogicサーバー上でオペレーショナルデータハブを迅速に構築するためのツールとライブラリのセットです。

データハブは、さまざまなサイロのデータを統合するリポジトリです。オペレーショナルデータハブパターンは、より迅速かつアジャイルなデータ統合を促進し、同時にデータへのリアルタイムの対話型アクセスを可能にするデータハブを構築する手法です。例えば、共有サービスと分析レポートは、データハブに追加データが統合されている場合でも、同時にデータハブにアクセスできます。

さらに、オペレーショナルデータハブでは以下のことが可能です。
  • エンティティレベルまたは属性レベルですべてのデータと運用を保護します。
  • データリネージをトレースします。データの出自読み込んだユーザーいつ行われるか

MarkLogicデータハブは、開発を短期間で開始するためのコードのスキャフォールディングを生成し、完全に自動化されたビルドを設定するためのDevOpsプロセスを提供します。

MarkLogicデータハブのコンセプト

さまざまなソースからデータハブにデータを読み込み、データを標準化することで、アプリケーションでデータを簡単に利用できます。データハブでは、Flowのステップを使用してこれを実現します。

Flowには、次のタイプのステップの組み合わせを含めることができます。

  • 読み込みでは、データをデータハブに取り込みます。
  • マッピングでは、エンティティモデルを使用してデータを標準化します。
  • マスタリングでは、重複のマッチングとマージを行います。
  • カスタムでは、データに対して追加処理を実行したり、他のステップタイプのデフォルト動作を置き換えたりできます。

詳細については、「エンティティ」、「Flow」、および「ステップ」を参照してください。

はじめに