MarkLogicデータハブ - リリースノート

データハブ5.0には、以下の新機能と変更が追加されています。

新しいFlow/ステップアーキテクチャ

MarkLogicデータハブv5.0では、Flowが、データを処理する一連のステップとして再定義されています。

基本的なユースケースにはコードテンプレートが提供されており、より複雑な状況に合わせてカスタマイズできます。

4.xからアップグレードした場合は、GradleタスクhubhubRunLegacyFlowを使用して、4.xのFlowを実行できます。ただし、QuickStartでFlowを表示または編集するには、5.0のFlowとステップに変換する必要があります。

MarkLogicデータハブへのスマートマスタリングの追加

データハブでは、MarkLogicスマートマスタリング技術を使用して、マスタリングステップ内で同じエンティティを参照するレコードをマージできるようになりました。

QuickStartを使用することで、エンティティモデルに基づいて、この新機能のマッチングとマージのオプションを設定できます。

ステップの実行履歴情報

すべてのタイプのステップ(読み込み、マッピング、マスタリング、カスタム)について、詳細な実行履歴情報が自動的に追跡されます。実行履歴情報には、次のような質問への回答が含まれます。

  • このエンティティインスタンスはいつ作成されたか。
  • このエンティティインスタンスはどのステップで作成されたか。
  • このエンティティインスタンスはどのFlowで作成されたか。
  • このエンティティインスタンスを作成したのはどのユーザーか。
スキーマの導入の変更
ローカルのschemasディレクトリは、以下のように変更されています。このディレクトリは、後でステージングスキーマデータベースに導入するスキーマを含めるための基盤となります。
  • 変更前:hub-internal-config/schemas
  • 変更後:ml-config/databases/mlStagingSchemasDbName/schemas。ここで、mlStagingSchemasDbNameは、指定されている場合はgradle.properties内のmlStagingSchemasDbNameの値です。デフォルトは ml-config/databases/data-hub-STAGING-SCHEMAS/schemasです。
後からステージングスキーマデータベースの名前を変更する場合は、次の操作を実行する必要があります。
  • ディレクトリの名前をml-config/databases/new-staging-schemas-db-name/schemasに変更し、
  • gradle.propertiesmlStagingSchemasDbNameの値を更新します。

この変更により、ステージングスキーマのディレクトリパスとml-gradleが整合されます。

マッピングとエンティティ

カスタマイズを簡素化するために、QuickStartでは、生成されたコードではなく、JSONファイルにマッピング情報が保存されます。マッピング設定ファイルは、your-project-root/mappings ディレクトリにあります。

同様に、エンティティ設定ファイルは、your-project-root/entitiesディレクトリに移動しました。

重要:データハブサービス上で、データハブv5.0を使用するには、お使いのDHS環境をアップグレードするためにサポートにご連絡いただく必要があります。