embulkの増分バルクインサート処理を使って、Oracle DBのデータをBigQueryへデータ連携させます。
増分バルクインサート処理の仕組みについて確認したいです。
※認識している増分バルクインサート処理のロジック
➀Embulk実行 ➁OracleへJDBC接続 ➂BigQueryに中間テーブルを生成 ➃インサート対象のレコード検索 ➄embulk内部ファイルへ書込み ➅embulk内部ファイルを中間テーブルへコピー ➆中間テーブルからBigQueryのテーブルへバルクインサート ➇中間テーブル削除 ➈embulk内部ファイル削除 ➉コミット ⒒結果ファイルへlast_record書き込み
上記ロジックであると認識していまして、
➃インサート対象のレコード検索
➃の処理について、実際DBに対してどのような検索をしているのか?
上記11の処理で、結果ファイルにlast_record(タイムスタンプ)を出力し、次回インサート処理時には結果ファイルを参照して、前回インサートしたレコード分はスキップする。
との情報を得ているのですが、embulkの内部DB?があって情報整理しているのか?
教えて頂きたいです。
回答4件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2019/02/13 01:45