データハブの用語集

エンティティ

エンタープライズ内の高レベルのビジネスオブジェクトのXMLまたはJSON表現。ビジネスオブジェクトの例としては、従業員、製品、発注書、部署などがあります。参照:エンティティ

エンティティサービス

MarkLogicで使用可能な標準機能のAPIと一連の規定により、エンティティモデリングに基づいてアプリケーションを迅速にセットアップできます。

Flow

データを処理する一連のステップ。データを別々に処理するように設定された複数のFlowを作成できます。参照:Flowについて

Flowトレーシング

Flowの実行時にFlowに関する情報をログに記録するプロセス。各Flowの各プラグインの入出力は、JOBSデータベースに記録されます。参照:Flowトレーシングについて

ハーモナイゼーション

さまざまな生データソースで別々に表現されている類似データを統合してマージするプロセス(通常はマッピングとスマートマスタリング)の概念的なセット。参照:マッピングスマートマスタリング

読み込み

以降の処理のために生データを取り込み、各項目をエンベロープでラップして、ラップされた項目をSTAGINGデータベースに格納するデータハブステップ。参照:ステップ

マッピング

エンティティモデルのフィールドをソースデータの対応するフィールドに関連付けるデータハブステップ。参照:ステップ

マスター管理

データに重複の可能性があるかどうかをチェックし、指定した基準に基づいてそうした重複を管理する、MarkLogicのスマートマスタリング技術を使用したデータハブステップ。マスタリングステップは、(2つ以上のレコードが同じエンティティを参照しているかどうかを判断するための)マッチングと、(同じエンティティを参照しているレコードをマージする方法を決定するための)マージから成ります。参照:ステップ

マッチング

データハブマスタリングステップの最初のプロセスでは、ルールとしきい値として定義された条件に基づいて、データ内で重複の可能性がないかどうかをチェックします。参照:マージ

マージ

データハブのマスタリングステップの2番目のプロセスでは、マッチングレコードを組み合わせる方法を決定します。参照:マッチング

出自とリネージ

データを出自まで遡及し、ソースデータを維持できるようにする自動化プロセス。参照:Flowトレーシング

ステップ

データを処理または強化するコード。ステップには、読み込みステップ、マッピングステップ、スマートマスタリングステップ、カスタムステップがあります。参照:ステップについて