質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
Linux

Linuxは、Unixをベースにして開発されたオペレーティングシステムです。日本では「リナックス」と呼ばれています。 主にWebサーバやDNSサーバ、イントラネットなどのサーバ用OSとして利用されています。 上位500のスーパーコンピュータの90%以上はLinuxを使用しています。 携帯端末用のプラットフォームAndroidは、Linuxカーネル上に構築されています。

Q&A

3回答

5309閲覧

linuxサーバ 大量のデータをコピーしたい

ruby5140

総合スコア9

Linux

Linuxは、Unixをベースにして開発されたオペレーティングシステムです。日本では「リナックス」と呼ばれています。 主にWebサーバやDNSサーバ、イントラネットなどのサーバ用OSとして利用されています。 上位500のスーパーコンピュータの90%以上はLinuxを使用しています。 携帯端末用のプラットフォームAndroidは、Linuxカーネル上に構築されています。

0グッド

0クリップ

投稿2021/02/08 06:51

linux(centos7)環境で、サーバ内で大量のデータ(数十TB)をコピーしようとしております。

・やりたいこと
同一サーバ内で、データのコピーがしたい
※disk(ストレージ)は別製品。

イメージ(例)
/tmp/aaa/bbb/ccc配下にあるデータを/tmp/aaa/bbb/ddd配下にコピー

/tmp/aaa/bbb/ccc配下は、下記のようなイメージで、数字のディレクトリがあるイメージです。
/tmp/aaa/bbb/ccc/10000
/tmp/aaa/bbb/ccc/10001
/tmp/aaa/bbb/ccc/10002
※1000xは、ディレクトリ名

cp -vrpa /tmp/aaa/bbb/ccc/* /tmp/aaa/bbb/ddd/* だと、Argmentエラーやサーバのメモリに負荷がかかってしまい、正常に完了しないなどの問題が起こりそうなため、分割してコピーしようと考えております。

※rsyncも考えておりますが負荷が凄そうなのと、分割してコピーができなそうなため保留にしております。

一旦テストで、cpで正規表現を使って、100-199のものをコピーできるか検証しております。

cp -vrpa /tmp/aaa/bbb/ccc/1[0-9][0-9]/* /tmp/aaa/bbb/ddd/1[0-9][0-9]/

これだと意図したコピーにならずでして、、正規表現の問題なのかうまくできずです、、
何か良い方法をアドバイス頂けますと幸いです。
※rsyncでも分割コピーができるのであればそちらでも問題ありません。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

hentaiman

2021/02/08 07:35

分割優先なのか負荷対策優先なのか分からないけど、分割に特に言及しているから分割優先ですかね?
yukky1201

2021/02/08 08:37

cp -vrpa /tmp/aaa/bbb/ccc/10000/* /tmp/aaa/bbb/ddd/10000/* cp -vrpa /tmp/aaa/bbb/ccc/10001/* /tmp/aaa/bbb/ddd/10001/* cp -vrpa /tmp/aaa/bbb/ccc/10002/* /tmp/aaa/bbb/ddd/10002/* と順番に実行するのではいけないのでしょうか。
ruby5140

2021/02/08 09:27

分割で実行しようとしているのは、負荷対策のために分割で実施しようとしております。 コピー元のデータが多すぎて、、1個1個順番に指定していると厳しそうでして、、 cp -vrpa /tmp/aaa/bbb/ccc/10000/* /tmp/aaa/bbb/ddd/10000/* cp -vrpa /tmp/aaa/bbb/ccc/10001/* /tmp/aaa/bbb/ddd/10001/* なので、正規表現なのかで、複数選択してcpできないか色々試しておりました。。
hentaiman

2021/02/08 10:14

じゃあrsyncで良いと思いますが、ローカルrsyncで掛かる負荷程度でリスクを懸念するとはスペックはどの程度なんでしょう?
guest

回答3

0

rsyncを使うべき状況ではないでしょうか。
rsync 負荷軽減でググってみるといいと思います。たとえば
HDD負荷軽減のために cp, mv コマンドの代わりに rsync コマンド使う | レンタルサーバー・自宅サーバー設定・構築のヒント
には、比較実験の結果が書かれていて、適切なオプション設定により、所要時間と引き換えにcpよりも負荷を軽くできることが書かれています。

投稿2021/02/08 07:38

KojiDoi

総合スコア13692

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

1ファイル何Gもあるような状況じゃなければrsyncが楽ですね

投稿2021/02/08 11:22

yambejp

総合スコア116724

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

これだと意図したコピーにならずでして、、

echo cp -vrpa /tmp/aaa/bbb/ccc/1[0-9][0-9]/* /tmp/aaa/bbb/ddd/1[0-9][0-9]/
してみてください。それが実行されるコマンドラインです。
パス名を複数指定した場合は、最後の1つ以外は「コピー元」と判断されます。

rsyncじゃなくて、ゆっくりコピーしたい(例えば、1ファイルコピーしたら0.1秒待つとか?)ということであれば、findコマンドなどでコピー対象のファイル一覧を作って、それを1行ずつ読みながらコピーするスクリプトを書けば良いかと。

投稿2021/02/08 11:18

otn

総合スコア85901

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問