やりたいこと
DynamoDBから何千万というレコードがあるテーブルからある日付以前のデータ取得したいです。
詰まっているところ
scanでデータ取得しているがfilterに一致するレコードがない場合、全データスキャンしてスループット値が足りないというエラーになってしまう。
試したこと
--max-item、--page-sizeなど取得に制限をかけるオプションをつけたが
それぞれ取得データ数やデータサイズに制限をかけるもので
filterに一致するレコードがない場合全スキャンしてしまい結果が変わらなかった。
スキャン自体に制限をかける方法はないでしょうか?
shell
1$ aws dynamodb scan --table_name $table_name --filter-expression "createdAt > :date" --expression-attribute-values '{":date":{"N":"111111111"}}'
こうすれば一応できる?
私が考えてるのは以下の方法です。
今:指定日付以前のデータをDynamoDBから取得
案:日付指定せずに全データを順次取得 > 取得データをローカルで日付で絞り込む
つまり、 DynamoDBで指定日付で絞り込みしていたのをやめて、全データを取得してからローカルで絞り込みするという方法です。
こうすれば--max-itemで100件などで取得していきローカルで日付絞り込むことで処理はできるかと思います。
ただ、非効率としか思えず他に良い方法をご教授願いたいです。mm
あなたの回答
tips
プレビュー