cassandraで並列書き込みの性能向上を目的として、dsbulkを導入することを検討しています。
現在は検証しているところで、お試しで以下のコマンドを並列で実行しています。
$ debunk load -url [csvファイル] -k [keystore] -t [テーブル]
書き込むファイルを事前にcsvファイルに書き出しておき、コマンドの引数に指定しています。
しかし、並列数が10あたりになるとCPUが90%を超えてしまい、30transaction/secondとなっております。
並列ではなく、単体で実行すると8,000transaction/secondとなることは確認しました。
並列処理で、transaction/secondを上げる施策をご教示いただけないでしょうか?
bulkは並列処理に向いていないのでしょうか・・?
あなたの回答
tips
プレビュー