MarkLogicデータハブ

概要

MarkLogicデータハブ は、MarkLogicサーバー上でオペレーショナルデータハブを迅速に構築するためのツールとライブラリのセットです。

データハブ」は、さまざまなサイロからのデータを統合するリポジトリです。「オペレーショナルデータハブパターン」は、より迅速かつアジャイルなデータ統合を促進するだけでなく、データへのリアルタイムの対話型アクセスを可能にするデータハブを構築する手法です。例えば、シェアードサービスと分析レポートは、データハブに追加データが統合されつつある間でも、同時にデータハブにアクセスできます。

さらに、オペレーショナルデータハブでは以下のことが可能です。
  • エンティティレベルまたは属性レベルですべてのデータと運用を保護します。
  • データリネージをトレースします。どこから来たのか?  誰が読み込んだのか?  いつ?

MarkLogicデータハブ は、開発をすぐに開始できるようにコードのスキャフォールディング(叩き台)を生成し、完全に自動化されたビルドをセットアップするためのDevOpsプロセスを提供します。

コンセプト: MarkLogicデータハブ

さまざまなソースからデータハブにデータを読み込み、データを標準化することで、アプリケーションでデータを容易に利用できます。データハブでは、フロー内のステップを使用してこれを実現します。

フローには、次のタイプのステップを組み合わせて含めることができます。

  • 読み込みでは、データをデータハブに取り込みます。
  • マッピングでは、エンティティモデルを使用してデータを標準化します。
  • マッチングでは、重複しているものを探します(複数ステップによるマスタリングプロセスの第1ステップです)。
  • マージングでは、重複しているものを合体させます(複数ステップによるマスタリングプロセスの第2ステップです)。
  • マスタリングでは、重複しているもののマッチングとマージを行います(ステップが統合されている従来のマスタリング処理)。
  • カスタムでは、データに対して追加処理を実行したり、他のステップタイプのデフォルト動作を置き換えたりできます。

詳細については、「エンティティ」、「フロー」、「ステップ」を参照してください。

始めてみましょう