MarkLogicデータハブ - リリースノート
データハブ5.0には、以下の新機能と変更が追加されています。
新しいFlow/ステップアーキテクチャ
MarkLogicデータハブへのスマートマスタリングの追加
データハブでは、MarkLogicスマートマスタリング技術を使用して、マスタリングステップ内で同じエンティティを参照するレコードをマージできるようになりました。
QuickStartを使用することで、エンティティモデルに基づいて、この新機能のマッチングとマージのオプションを設定できます。
ステップの実行履歴情報
すべてのタイプのステップ(読み込み、マッピング、マスタリング、カスタム)について、詳細な実行履歴情報が自動的に追跡されます。実行履歴情報には、次のような質問への回答が含まれます。
- このエンティティインスタンスはいつ作成されたか。
- このエンティティインスタンスはどのステップで作成されたか。
- このエンティティインスタンスはどのFlowで作成されたか。
- このエンティティインスタンスを作成したのはどのユーザーか。
スキーマの導入の変更
ローカルのschemasディレクトリは、以下のように変更されています。このディレクトリは、後でステージングスキーマデータベースに導入するスキーマを含めるための基盤となります。
- 変更前:hub-internal-config/schemas
- 変更後:ml-config/databases/mlStagingSchemasDbName/schemas。ここで、mlStagingSchemasDbNameは、指定されている場合はgradle.properties内のmlStagingSchemasDbNameの値です。デフォルトは ml-config/databases/data-hub-STAGING-SCHEMAS/schemasです。
後からステージングスキーマデータベースの名前を変更する場合は、次の操作を実行する必要があります。
- ディレクトリの名前をml-config/databases/new-staging-schemas-db-name/schemasに変更し、
- gradle.propertiesのmlStagingSchemasDbNameの値を更新します。
この変更により、ステージングスキーマのディレクトリパスとml-gradleが整合されます。
マッピングとエンティティ
カスタマイズを簡素化するために、QuickStartでは、生成されたコードではなく、JSONファイルにマッピング情報が保存されます。マッピング設定ファイルは、your-project-root/mappings ディレクトリにあります。
同様に、エンティティ設定ファイルは、your-project-root/entitiesディレクトリに移動しました。