QuickStartによるステップの作成

始める前に

以下が必要です。

このタスクについて

フローには少なくとも1つのステップを含める必要があります。QuickStartでは、フローの編集時にステップを作成できます。

手順

  1. 対象となるフローのフロー定義に移動します。

    QuickStartフロー - Manage Flowsテーブル - フロー名をクリック

    1. QuickStartのナビゲーションバーで、[Flows]をクリックします。
    2. [Manage Flows]テーブルで、このフローを含む行を探します。
      ヒント: 楽に探せるように、いずれかの列でテーブルをソートできます。
    3. このフローの名前をクリックします。
  2. フロー定義ページで、New Stepをクリックします。

    QuickStartステップ - 新規ステップ

  3. [New Step]ダイアログで、[Step Type]を選択します。
    • 読み込み(Ingestion)
    • マッピング
    • マッチング
    • マージング
    • マスタリング
    • Custom
  4. Customを選択した場合、カスタムステップのタイプも選択する必要があります。

    カスタムステップのタイプとしては、Ingestion(読み込み)MappingMasteringOtherがあります。これらのカスタムステップのタイプでは、デフォルト設定としてより特化したステップ定義を提供しています。


    QuickStart Step - 新規カスタムステップダイアログのカスタムステップタイプフィールド

  5. ステップを設定します。
    1. Advanced Settingsセクションを展開して、追加フィールドを表示します。
    2. カスタムフックを追加するには、Custom Hookセクションを展開します。
      詳細は、カスタムフックモジュールの作成を参照してください。

    QuickStartステップ - 新規読み込みステップダイアログ

    フィールド 説明
    名前ステップインスタンスの名前です。
    説明(オプション)ステップの説明です。
    Target Database 処理済みデータを保存するデータベース。 読み込まれたデータの保存先としてステージングデータベースを選択します。デフォルトは、data-hub-STAGINGです。
    Additional Target Collections 処理済みのレコードに追加されるコレクションタグ。デフォルトでは、処理済みのレコードは、ステップと同じ名前のコレクションに追加されます。これらのレコードに対してさらにコレクションを追加できます(1つあるいは複数のコレクションタグを指定します)。
    • をクリックしてコレクションタグを追加します。
    • 削除するには、コレクションタグの隣にあるをクリックします。
    Batch Size 1つのバッチで処理するドキュメントの数。各バッチでは、フロー内のステップを最初から最後まですべて実行したあとで、次のバッチを開始します。バッチサイズは小さい方が柔軟性があり、データ全体を対象にする前に処理を止めたりモジュールを調整したりできます。またより詳細なジョブレポートを作成できます。しかしながら、処理のオーバーヘッドによりコストが大きくなります。これは1以上に設定する必要があります。デフォルトは100です。
    Thread Count フローを実行するときに使用するスレッドの数。デフォルトは4です。
    Custom Hook: Module このカスタムフックモジュールへのパスです。
    Custom Hook: Parameters このカスタムフックモジュールに渡すパラメータ(キー/バリューのペア)です。
    Custom Hook: User このモジュールを実行するためのユーザーアカウントです。デフォルトはこのフローを実行しているユーザーです(flow-operatorなど)。
    Custom Hook: RunBefore ステップ前のフックの場合、trueと指定します。ステップ後のフックの場合、falseと指定します。

    QuickStartステップ - 新規マッピングステップダイアログ

    フィールド 説明
    名前ステップインスタンスの名前です。
    説明(オプション)ステップの説明です。
    Source Type このフローで処理するソースデータを選択するために使用するフィルタ です。
    • Collection
    • クエリ
    Source Collection ([Source Type]が[Collection]の場合に表示されます)。このステップで処理するデータのコレクション。
    Source Query ([Source Type]が[Query]の場合に表示されます)。処理するソースデータを選択するために使用するCTSクエリです。。詳細は、CTSクエリを参照してください。
    Target Entity ソースデータに対してマッピングするエンティティ。フローにマッピングステップが含まれている場合にのみ必要です。
    Source Database 入力データの取得元のデータベース。 読み込まれたデータの保存先としてステージングデータベースを選択します。デフォルトは、data-hub-STAGINGです。
    Target Database 処理済みデータを保存するデータベース。 マッピング済みデータの保存先としてステージングデータベースを選択します。デフォルトは、data-hub-FINALです。
    Target Format 処理済みのレコードの形式。テキスト、JSON、XML、バイナリ。デフォルトはJSONです。
    Additional Target Collections 処理済みのレコードに追加されるコレクションタグ。デフォルトでは、処理済みのレコードは、ステップと同じ名前のコレクションに追加されます。これらのレコードに対してさらにコレクションを追加できます(1つあるいは複数のコレクションタグを指定します)。
    • をクリックしてコレクションタグを追加します。
    • 削除するには、コレクションタグの隣にあるをクリックします。
    Batch Size 1つのバッチで処理するドキュメントの数。各バッチでは、フロー内のステップを最初から最後まですべて実行したあとで、次のバッチを開始します。バッチサイズは小さい方が柔軟性があり、データ全体を対象にする前に処理を止めたりモジュールを調整したりできます。またより詳細なジョブレポートを作成できます。しかしながら、処理のオーバーヘッドによりコストが大きくなります。これは1以上に設定する必要があります。デフォルトは100です。
    Thread Count フローを実行するときに使用するスレッドの数。デフォルトは4です。
    Custom Hook: Module このカスタムフックモジュールへのパスです。
    Custom Hook: Parameters このカスタムフックモジュールに渡すパラメータ(キー/バリューのペア)です。
    Custom Hook: User このモジュールを実行するためのユーザーアカウントです。デフォルトはこのフローを実行しているユーザーです(flow-operatorなど)。
    Custom Hook: RunBefore ステップ前のフックの場合、trueと指定します。ステップ後のフックの場合、falseと指定します。

    QuickStartステップ - 新規マッチングステップダイアログ

    フィールド 説明
    名前ステップインスタンスの名前です。
    説明(オプション)ステップの説明です。
    Source Type このフローで処理するソースデータを選択するために使用するフィルタ です。
    • Collection
    • クエリ
    Source Collection ([Source Type]が[Collection]の場合に表示されます)。このステップで処理するデータのコレクション。
    Source Query ([Source Type]が[Query]の場合に表示されます)。処理するソースデータを選択するために使用するCTSクエリです。。詳細は、CTSクエリを参照してください。
    Target Entity ソースデータに対してマッピングするエンティティ。フローにマッピングステップが含まれている場合にのみ必要です。
    Source Database 入力データの取得元のデータベース。 マッピング済みデータを保存したファイナルデータベースを選択します。デフォルトは、data-hub-FINALです。
    Target Database

    処理済みデータを保存するデータベース。 Source Databaseで選択したのと同じデータベースを選択します。デフォルトは、data-hub-FINALです。

    重要: 分割マスタリング(マッチングステップとマージングステップからなる)では、両方のステップにおいてソースデータベースとターゲットデータベースが同じである必要があります。
    Target Format 処理済みのレコードの形式。テキスト、JSON、XML、バイナリ。デフォルトはJSONです。
    Additional Target Collections 処理済みのレコードに追加されるコレクションタグ。デフォルトでは、処理済みのレコードは、ステップと同じ名前のコレクションに追加されます。これらのレコードに対してさらにコレクションを追加できます(1つあるいは複数のコレクションタグを指定します)。
    • をクリックしてコレクションタグを追加します。
    • 削除するには、コレクションタグの隣にあるをクリックします。
    Batch Size 1つのバッチで処理するドキュメントの数。各バッチでは、フロー内のステップを最初から最後まですべて実行したあとで、次のバッチを開始します。バッチサイズは小さい方が柔軟性があり、データ全体を対象にする前に処理を止めたりモジュールを調整したりできます。またより詳細なジョブレポートを作成できます。しかしながら、処理のオーバーヘッドによりコストが大きくなります。これは1以上に設定する必要があります。デフォルトは100です。
    Thread Count フローを実行するときに使用するスレッドの数。デフォルトは4です。
    Custom Hook: Module このカスタムフックモジュールへのパスです。
    Custom Hook: Parameters このカスタムフックモジュールに渡すパラメータ(キー/バリューのペア)です。
    Custom Hook: User このモジュールを実行するためのユーザーアカウントです。デフォルトはこのフローを実行しているユーザーです(flow-operatorなど)。
    Custom Hook: RunBefore ステップ前のフックの場合、trueと指定します。ステップ後のフックの場合、falseと指定します。

    QuickStartステップ - 新規マージングステップダイアログ

    フィールド 説明
    名前ステップインスタンスの名前です。
    説明(オプション)ステップの説明です。
    Source Type このフローで処理するソースデータを選択するために使用するフィルタ です。
    • Collection
    • クエリ
    Source Collection ([Source Type]が[Collection]の場合に表示されます)。このステップで処理するデータのコレクション。
    Source Query ([Source Type]が[Query]の場合に表示されます)。処理するソースデータを選択するために使用するCTSクエリです。。詳細は、CTSクエリを参照してください。
    Target Entity ソースデータに対してマッピングするエンティティ。フローにマッピングステップが含まれている場合にのみ必要です。
    Source Database 入力データの取得元のデータベース。 マッチングステップで選択したソースデータベースと同じものを選択してください。デフォルトは、data-hub-FINALです。
    Target Database

    処理済みデータを保存するデータベース。 Source Databaseで選択したのと同じデータベースを選択します。デフォルトは、data-hub-FINALです。

    重要: 分割マスタリング(マッチングステップとマージングステップからなる)では、両方のステップにおいてソースデータベースとターゲットデータベースが同じである必要があります。
    Target Format 処理済みのレコードの形式。テキスト、JSON、XML、バイナリ。デフォルトはJSONです。
    Additional Target Collections 処理済みのレコードに追加されるコレクションタグ。デフォルトでは、処理済みのレコードは、ステップと同じ名前のコレクションに追加されます。これらのレコードに対してさらにコレクションを追加できます(1つあるいは複数のコレクションタグを指定します)。
    • をクリックしてコレクションタグを追加します。
    • 削除するには、コレクションタグの隣にあるをクリックします。
    Batch Size 1つのバッチで処理するドキュメントの数。各バッチでは、フロー内のステップを最初から最後まですべて実行したあとで、次のバッチを開始します。バッチサイズは小さい方が柔軟性があり、データ全体を対象にする前に処理を止めたりモジュールを調整したりできます。またより詳細なジョブレポートを作成できます。しかしながら、処理のオーバーヘッドによりコストが大きくなります。これは1以上に設定する必要があります。デフォルトは100です。
    Thread Count フローを実行するときに使用するスレッドの数。デフォルトは4です。
    Custom Hook: Module このカスタムフックモジュールへのパスです。
    Custom Hook: Parameters このカスタムフックモジュールに渡すパラメータ(キー/バリューのペア)です。
    Custom Hook: User このモジュールを実行するためのユーザーアカウントです。デフォルトはこのフローを実行しているユーザーです(flow-operatorなど)。
    Custom Hook: RunBefore ステップ前のフックの場合、trueと指定します。ステップ後のフックの場合、falseと指定します。

    QuickStartステップ - 新規マスタリングステップダイアログ

    フィールド 説明
    名前ステップインスタンスの名前です。
    説明(オプション)ステップの説明です。
    Source Type このフローで処理するソースデータを選択するために使用するフィルタ です。
    • Collection
    • クエリ
    Source Collection ([Source Type]が[Collection]の場合に表示されます)。このステップで処理するデータのコレクション。
    Source Query ([Source Type]が[Query]の場合に表示されます)。処理するソースデータを選択するために使用するCTSクエリです。。詳細は、CTSクエリを参照してください。
    Target Entity ソースデータに対してマッピングするエンティティ。フローにマッピングステップが含まれている場合にのみ必要です。
    Source Database 入力データの取得元のデータベース。 マッピング済みデータを保存したファイナルデータベースを選択します。デフォルトは、data-hub-FINALです。
    Target Database

    処理済みデータを保存するデータベース。 マスタリング済みデータの保存先としてステージングデータベースを選択します。デフォルトは、data-hub-FINALです。

    重要: 統合マスタリング(マスタリングステップ)では、ソースデータベースとターゲットデータベースは同じであるはずです。重複が見つかった場合は、元のレコードがアーカイブされ、マージされたバージョンが同じデータベースに追加されます。ターゲットデータベースが異なる場合は、カスタムモジュールを使用してカスタムステップを作成し、マスタリングステップのデフォルト動作を上書きできます。
    Target Format 処理済みのレコードの形式。テキスト、JSON、XML、バイナリ。デフォルトはJSONです。
    Additional Target Collections 処理済みのレコードに追加されるコレクションタグ。デフォルトでは、処理済みのレコードは、ステップと同じ名前のコレクションに追加されます。これらのレコードに対してさらにコレクションを追加できます(1つあるいは複数のコレクションタグを指定します)。
    • をクリックしてコレクションタグを追加します。
    • 削除するには、コレクションタグの隣にあるをクリックします。
    Batch Size 1つのバッチで処理するドキュメントの数。各バッチでは、フロー内のステップを最初から最後まですべて実行したあとで、次のバッチを開始します。バッチサイズは小さい方が柔軟性があり、データ全体を対象にする前に処理を止めたりモジュールを調整したりできます。またより詳細なジョブレポートを作成できます。しかしながら、処理のオーバーヘッドによりコストが大きくなります。これは1以上に設定する必要があります。デフォルトは100です。
    Thread Count フローを実行するときに使用するスレッドの数。マスタリングステップでは、この値は必ず1にしてください。パフォーマンスを改善するためにスレッドの数を増やす場合は、マスタリングステップではなく、マッチングステップおよびマージングステップを作成してください。デフォルトは1です。
    Custom Hook: Module このカスタムフックモジュールへのパスです。
    Custom Hook: Parameters このカスタムフックモジュールに渡すパラメータ(キー/バリューのペア)です。
    Custom Hook: User このモジュールを実行するためのユーザーアカウントです。デフォルトはこのフローを実行しているユーザーです(flow-operatorなど)。
    Custom Hook: RunBefore ステップ前のフックの場合、trueと指定します。ステップ後のフックの場合、falseと指定します。

    QuickStartステップ - 新規カスタム読み込みステップダイアログ

    フィールド 説明
    名前ステップインスタンスの名前です。
    説明(オプション)ステップの説明です。
    Target Database 処理済みデータを保存するデータベース。
    • 読み込まれたデータの保存先としてステージングデータベースを選択します。デフォルトは、data-hub-STAGINGです。
    • マッピング済みデータの保存先としてステージングデータベースを選択します。デフォルトは、data-hub-FINALです。
    • マスタリング済みデータの保存先としてステージングデータベースを選択します。デフォルトは、data-hub-FINALです。
    重要:

    統合マスタリング(マスタリングステップ)では、ソースデータベースとターゲットデータベースは同じであるはずです。重複が見つかった場合は、元のレコードがアーカイブされ、マージされたバージョンが同じデータベースに追加されます。ターゲットデータベースが異なる場合は、カスタムモジュールを使用してカスタムステップを作成し、マスタリングステップのデフォルト動作を上書きできます。

    分割マスタリング(マッチングステップとマージングステップからなる)では、両方のステップにおいてソースデータベースとターゲットデータベースが同じである必要があります。

    Target Format 処理済みのレコードの形式。テキスト、JSON、XML、バイナリ。デフォルトはJSONです。
    Additional Target Collections 処理済みのレコードに追加されるコレクションタグ。デフォルトでは、処理済みのレコードは、ステップと同じ名前のコレクションに追加されます。これらのレコードに対してさらにコレクションを追加できます(1つあるいは複数のコレクションタグを指定します)。
    • をクリックしてコレクションタグを追加します。
    • 削除するには、コレクションタグの隣にあるをクリックします。
    Batch Size 1つのバッチで処理するドキュメントの数。各バッチでは、フロー内のステップを最初から最後まですべて実行したあとで、次のバッチを開始します。バッチサイズは小さい方が柔軟性があり、データ全体を対象にする前に処理を止めたりモジュールを調整したりできます。またより詳細なジョブレポートを作成できます。しかしながら、処理のオーバーヘッドによりコストが大きくなります。これは1以上に設定する必要があります。デフォルトは100です。
    Thread Count フローを実行するときに使用するスレッドの数。デフォルトは4です。
    Custom Hook: Module このカスタムフックモジュールへのパスです。
    Custom Hook: Parameters このカスタムフックモジュールに渡すパラメータ(キー/バリューのペア)です。
    Custom Hook: User このモジュールを実行するためのユーザーアカウントです。デフォルトはこのフローを実行しているユーザーです(flow-operatorなど)。
    Custom Hook: RunBefore ステップ前のフックの場合、trueと指定します。ステップ後のフックの場合、falseと指定します。
    Options フローの各ステップ内のカスタムモジュールにパラメータとして渡すキー/バリューペア。

    QuickStartステップ - 新規カスタムマッピングステップダイアログ

    フィールド 説明
    名前ステップインスタンスの名前です。
    説明(オプション)ステップの説明です。
    Source Type このフローで処理するソースデータを選択するために使用するフィルタ です。
    • Collection
    • クエリ
    Source Collection ([Source Type]が[Collection]の場合に表示されます)。このステップで処理するデータのコレクション。
    Source Query ([Source Type]が[Query]の場合に表示されます)。処理するソースデータを選択するために使用するCTSクエリです。。詳細は、CTSクエリを参照してください。
    Target Entity ソースデータに対してマッピングするエンティティ。フローにマッピングステップが含まれている場合にのみ必要です。
    Source Database 入力データの取得元のデータベース。
    • マッピング:読み込まれたデータの保存先としてステージングデータベースを選択します。デフォルトは、data-hub-STAGINGです。
    • マスタリング:マッピング済みデータを保存したファイナルデータベースを選択します。デフォルトは、data-hub-FINALです。
    Target Database 処理済みデータを保存するデータベース。
    • 読み込まれたデータの保存先としてステージングデータベースを選択します。デフォルトは、data-hub-STAGINGです。
    • マッピング済みデータの保存先としてステージングデータベースを選択します。デフォルトは、data-hub-FINALです。
    • マスタリング済みデータの保存先としてステージングデータベースを選択します。デフォルトは、data-hub-FINALです。
    重要:

    統合マスタリング(マスタリングステップ)では、ソースデータベースとターゲットデータベースは同じであるはずです。重複が見つかった場合は、元のレコードがアーカイブされ、マージされたバージョンが同じデータベースに追加されます。ターゲットデータベースが異なる場合は、カスタムモジュールを使用してカスタムステップを作成し、マスタリングステップのデフォルト動作を上書きできます。

    分割マスタリング(マッチングステップとマージングステップからなる)では、両方のステップにおいてソースデータベースとターゲットデータベースが同じである必要があります。

    Target Format 処理済みのレコードの形式。テキスト、JSON、XML、バイナリ。デフォルトはJSONです。
    Additional Target Collections 処理済みのレコードに追加されるコレクションタグ。デフォルトでは、処理済みのレコードは、ステップと同じ名前のコレクションに追加されます。これらのレコードに対してさらにコレクションを追加できます(1つあるいは複数のコレクションタグを指定します)。
    • をクリックしてコレクションタグを追加します。
    • 削除するには、コレクションタグの隣にあるをクリックします。
    Batch Size 1つのバッチで処理するドキュメントの数。各バッチでは、フロー内のステップを最初から最後まですべて実行したあとで、次のバッチを開始します。バッチサイズは小さい方が柔軟性があり、データ全体を対象にする前に処理を止めたりモジュールを調整したりできます。またより詳細なジョブレポートを作成できます。しかしながら、処理のオーバーヘッドによりコストが大きくなります。これは1以上に設定する必要があります。デフォルトは100です。
    Thread Count フローを実行するときに使用するスレッドの数。デフォルトは4です。
    Custom Hook: Module このカスタムフックモジュールへのパスです。
    Custom Hook: Parameters このカスタムフックモジュールに渡すパラメータ(キー/バリューのペア)です。
    Custom Hook: User このモジュールを実行するためのユーザーアカウントです。デフォルトはこのフローを実行しているユーザーです(flow-operatorなど)。
    Custom Hook: RunBefore ステップ前のフックの場合、trueと指定します。ステップ後のフックの場合、falseと指定します。
    Options フローの各ステップ内のカスタムモジュールにパラメータとして渡すキー/バリューペア。

    QuickStartステップ - 新規カスタムマスタリングステップダイアログ

    フィールド 説明
    名前ステップインスタンスの名前です。
    説明(オプション)ステップの説明です。
    Source Type このフローで処理するソースデータを選択するために使用するフィルタ です。
    • Collection
    • クエリ
    Source Collection ([Source Type]が[Collection]の場合に表示されます)。このステップで処理するデータのコレクション。
    Source Query ([Source Type]が[Query]の場合に表示されます)。処理するソースデータを選択するために使用するCTSクエリです。。詳細は、CTSクエリを参照してください。
    Target Entity ソースデータに対してマッピングするエンティティ。フローにマッピングステップが含まれている場合にのみ必要です。
    Source Database 入力データの取得元のデータベース。
    • マッピング:読み込まれたデータの保存先としてステージングデータベースを選択します。デフォルトは、data-hub-STAGINGです。
    • マスタリング:マッピング済みデータを保存したファイナルデータベースを選択します。デフォルトは、data-hub-FINALです。
    Target Database 処理済みデータを保存するデータベース。
    • 読み込まれたデータの保存先としてステージングデータベースを選択します。デフォルトは、data-hub-STAGINGです。
    • マッピング済みデータの保存先としてステージングデータベースを選択します。デフォルトは、data-hub-FINALです。
    • マスタリング済みデータの保存先としてステージングデータベースを選択します。デフォルトは、data-hub-FINALです。
    重要:

    統合マスタリング(マスタリングステップ)では、ソースデータベースとターゲットデータベースは同じであるはずです。重複が見つかった場合は、元のレコードがアーカイブされ、マージされたバージョンが同じデータベースに追加されます。ターゲットデータベースが異なる場合は、カスタムモジュールを使用してカスタムステップを作成し、マスタリングステップのデフォルト動作を上書きできます。

    分割マスタリング(マッチングステップとマージングステップからなる)では、両方のステップにおいてソースデータベースとターゲットデータベースが同じである必要があります。

    Target Format 処理済みのレコードの形式。テキスト、JSON、XML、バイナリ。デフォルトはJSONです。
    Additional Target Collections 処理済みのレコードに追加されるコレクションタグ。デフォルトでは、処理済みのレコードは、ステップと同じ名前のコレクションに追加されます。これらのレコードに対してさらにコレクションを追加できます(1つあるいは複数のコレクションタグを指定します)。
    • をクリックしてコレクションタグを追加します。
    • 削除するには、コレクションタグの隣にあるをクリックします。
    Batch Size 1つのバッチで処理するドキュメントの数。各バッチでは、フロー内のステップを最初から最後まですべて実行したあとで、次のバッチを開始します。バッチサイズは小さい方が柔軟性があり、データ全体を対象にする前に処理を止めたりモジュールを調整したりできます。またより詳細なジョブレポートを作成できます。しかしながら、処理のオーバーヘッドによりコストが大きくなります。これは1以上に設定する必要があります。デフォルトは100です。
    Thread Count フローを実行するときに使用するスレッドの数。デフォルトは4です。
    Custom Hook: Module このカスタムフックモジュールへのパスです。
    Custom Hook: Parameters このカスタムフックモジュールに渡すパラメータ(キー/バリューのペア)です。
    Custom Hook: User このモジュールを実行するためのユーザーアカウントです。デフォルトはこのフローを実行しているユーザーです(flow-operatorなど)。
    Custom Hook: RunBefore ステップ前のフックの場合、trueと指定します。ステップ後のフックの場合、falseと指定します。
    Options フローの各ステップ内のカスタムモジュールにパラメータとして渡すキー/バリューペア。

    QuickStartステップ - 新規カスタムOtherステップダイアログ

    フィールド 説明
    名前ステップインスタンスの名前です。
    説明(オプション)ステップの説明です。
    Source Type このフローで処理するソースデータを選択するために使用するフィルタ です。
    • Collection
    • クエリ
    Source Collection ([Source Type]が[Collection]の場合に表示されます)。このステップで処理するデータのコレクション。
    Source Query ([Source Type]が[Query]の場合に表示されます)。処理するソースデータを選択するために使用するCTSクエリです。。詳細は、CTSクエリを参照してください。
    Target Entity ソースデータに対してマッピングするエンティティ。フローにマッピングステップが含まれている場合にのみ必要です。
    Source Database 入力データの取得元のデータベース。
    • マッピング:読み込まれたデータの保存先としてステージングデータベースを選択します。デフォルトは、data-hub-STAGINGです。
    • マスタリング:マッピング済みデータを保存したファイナルデータベースを選択します。デフォルトは、data-hub-FINALです。
    Target Database 処理済みデータを保存するデータベース。
    • 読み込まれたデータの保存先としてステージングデータベースを選択します。デフォルトは、data-hub-STAGINGです。
    • マッピング済みデータの保存先としてステージングデータベースを選択します。デフォルトは、data-hub-FINALです。
    • マスタリング済みデータの保存先としてステージングデータベースを選択します。デフォルトは、data-hub-FINALです。
    重要:

    統合マスタリング(マスタリングステップ)では、ソースデータベースとターゲットデータベースは同じであるはずです。重複が見つかった場合は、元のレコードがアーカイブされ、マージされたバージョンが同じデータベースに追加されます。ターゲットデータベースが異なる場合は、カスタムモジュールを使用してカスタムステップを作成し、マスタリングステップのデフォルト動作を上書きできます。

    分割マスタリング(マッチングステップとマージングステップからなる)では、両方のステップにおいてソースデータベースとターゲットデータベースが同じである必要があります。

    Target Format 処理済みのレコードの形式。テキスト、JSON、XML、バイナリ。デフォルトはJSONです。
    Additional Target Collections 処理済みのレコードに追加されるコレクションタグ。デフォルトでは、処理済みのレコードは、ステップと同じ名前のコレクションに追加されます。これらのレコードに対してさらにコレクションを追加できます(1つあるいは複数のコレクションタグを指定します)。
    • をクリックしてコレクションタグを追加します。
    • 削除するには、コレクションタグの隣にあるをクリックします。
    Batch Size 1つのバッチで処理するドキュメントの数。各バッチでは、フロー内のステップを最初から最後まですべて実行したあとで、次のバッチを開始します。バッチサイズは小さい方が柔軟性があり、データ全体を対象にする前に処理を止めたりモジュールを調整したりできます。またより詳細なジョブレポートを作成できます。しかしながら、処理のオーバーヘッドによりコストが大きくなります。これは1以上に設定する必要があります。デフォルトは100です。
    Thread Count フローを実行するときに使用するスレッドの数。デフォルトは4です。
    Custom Hook: Module このカスタムフックモジュールへのパスです。
    Custom Hook: Parameters このカスタムフックモジュールに渡すパラメータ(キー/バリューのペア)です。
    Custom Hook: User このモジュールを実行するためのユーザーアカウントです。デフォルトはこのフローを実行しているユーザーです(flow-operatorなど)。
    Custom Hook: RunBefore ステップ前のフックの場合、trueと指定します。ステップ後のフックの場合、falseと指定します。
    Options フローの各ステップ内のカスタムモジュールにパラメータとして渡すキー/バリューペア。
  6. Saveをクリックします。

タスクの結果

新しいステップのサマリーボックスが、上部のフローパネルのフローシーケンスに追加されます。

ステップパネルには、ステップの詳細が表示されます。

次のタスク

ステップの詳細を設定します。