データハブサービスへのデプロイ
データハブサービス
自分で環境を構築する代わりに、データハブプロジェクトをクラウドにデプロイできます。データハブサービス(DHS)は、事前設定されたMarkLogicクラスタを提供するクラウドベースのソリューションです。ここでフローを実行し、ハーモナイズされたデータを提供できます。
MarkLogicデータハブを使用して、プロジェクトをローカル(開発環境)で開発およびテストし、それをDHSクラスタ(本番環境)に導入します。
ヒント:複数のサービスで同じデータハブプロジェクトファイルを流用できます。例えば、あるDHSプロジェクトをテスト環境として、また別のDHSプロジェクトを本番環境としてセットアップできます。
DHS環境では、データベース、アプリケーションサーバー、およびセキュリティロールが自動的に設定されます。管理者はユーザーアカウントを作成できます。
データハブサービス(DHS)の詳細については、「データハブサービス」および「DHSのドキュメント」を参照してください。
データハブプロジェクトとDHSプロジェクトでは、以下の設定が若干異なる可能性があります。
- ロール – DHSのロールは、DHS環境のプロビジョニングの一環として自動的に作成されます。
データハブ DHS data-hub-admin endpointDeveloper endpointUser flow-developer flowDeveloper flow-operator flowOperator - データベース名 — データベース環境内でデータベース名を変更している場合、これらは違っています。
- Gradle設定 —
gradle.properties
ファイルには、DHS専用の設定が含まれています。例えばmlIsHostLoadBalancer
およびmlIsProvisionedEnvironment
がtrue
に設定され、データハブがDHS内で適切に動くようになっています。
データハブプロジェクトとDHSプロジェクトでは、以下の設定は共通です。
- アプリケーションサーバー用のポートとロードバランサー
アプリケーションサーバー ポート DHSロードバランサー staging 8010 curation final 8011 operations Jobs 8013 analytics 重要:データハブフレームワークのコアのみをデプロイする場合、ポート8004を使用します。ファイナルデータベースにカスタムプラグイン(REST拡張機能、検索オプションなど)を導入するには、ポート8011を使用します。
エンドポイントがプライベートの場合は、MarkLogic VPCにアクセスできる踏み台ホストが仮想プライベートクラウド(VPC)内に必要です。踏み台ホストは以下を安全に中継します。
- 外部環境からのMarkLogicへのリクエスト
- MarkLogicからのリクエスト元への結果
エンドポイントが公開されている場合は、MarkLogic VPCのピアとして設定されている任意のマシンを使用できます。詳細は、「ピアロールの作成 - AWS」を参照してください。
重要:データハブのQuickStartツールは、DHSでは使用できません。
準備
- ローカルでセットアップおよびテストされたデータハブプロジェクト
- プロビジョニングされたMarkLogicデータハブサービス環境
- プライベートエンドポイントの場合のみ:仮想プライベートクラウド(VPC)内の踏み台ホスト
- DHS管理者からの情報:
- DHSホスト名(通常はキュレーションエンドポイント)
- テスト用のRESTキュレーションエンドポイントURL(ポート番号を含む)
- 次の各ロールに関連付けられているユーザーアカウントのユーザー名とパスワード(詳細は、「DHSインスタンスのユーザーアカウントを作成する」を参照してください)
endpointDeveloper
endpointUser
flowDeveloper
flowOperator
手順
次に行うこと
プロジェクトの初回アップロード後にフローを更新する場合、gradle dhsDeploy
を再度実行してからこのフローを実行することで、フローを再デプロイできます。