概要
非常に件数の多いデータをデータベースにINSERTする必要がありまして、
処理に膨大な時間がかかりそうなので、途中失敗を避けるためありえそうなリスクをあらかじめ知っておきたいと考えています。
もし何か知見をお持ちの方がいらっしゃいましたら、アドバイスいただけると助かります。
要件
使用するハードとソフトの要件は以下の通りです。
PC:amazon RDSのdb.m7g.large(AWS Graviton3 プロセッサ、メモリ8GB、ストレージ1TB)
OS:Amazon Linux2
データベース:MariaDB10.6
登録するデータ:1レコード当たり1kB程度のデータを約5億(500M)件分
付与するインデックス:auto incrementするIDと、別に登録するIDの 計2つ
具体的に質問したいこと
- そもそもPCのスペックは足りそうでしょうか?
まず、データの合計サイズは1kB x 500M件 なので、少なくとも500GBのストレージは必要になるはずです(インデックスも含めるともっとかも)。
一方、メモリの方は実際どの程度必要かよくわかりません。(処理の途中でメモリ上限を超えたりすると困ります。)
他にスペックで問題のありそうなところがあれば教えてほしいです。
- ありがちな設定ミスがあれば教えてください。
例えば、データベースの隠れた上限閾値があるとか、何か特別な設定が必要とか、
ビッグデータをデータベースに登録するにあたり、何か気を付ける点があれば教えてほしいです。
回答5件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2023/09/29 15:21