フォルダ内の画像をランダムで特定の割合に分けたい

Question

###実現したいこと
pythonにおいて指定したディレクトリ内の画像を例えば7:3とかの割合に(できればランダムで)分けて2つのディレクトリに保存したいと考えています。自分の知識では思いつかなかったので、皆様の力をお借りしたいです。

###階層例
例えば

__img__
|-img1.jpg
|-img2.jpg
     .
     .
     .

というディレクトリを

__img__
|-dir1
| |-img1_1.jpg
| |-img1_2.jpg
| .
| .
| .
|-dir2
| |-img2_1.jpg
| |-img2_2.jpg
| .
| .
| .

というように２つのディレクトリに分けたいということです。図がわかりづらくて申し訳ありません。

###使用環境
python 3.6.3

Accepted Answer

概念コードです。
- 指定ディレクトリ配下から対象ファイルパスを取得する処理
- 指定ファイルを指定ディレクトリに移動する処理

はご自身でコーディングください。
```Python
# 指定ディレクトリから対象ファイルパスを取得
files = ['img%03d.jpg'%(i+1) for i in range(100)]
print(files)

# 乱数により移動先を振り分け
import random
for f in files:
    if random.random() >= 0.3: # 70%
        # dir1へ移動
        print('dir1',f)
    else:                      # 30%
        # dir2へ移動
        print('dir2',f)
```

Answer

質問の意向を完全に無視する形になりますがディレクトリに分けず、全ての画像データとラベルデータをひとまとめにして分けることを考えれば、例えばsklearnなどのライブラリを使えば簡単に分類することが可能です。
```python
from sklearn.cross_validation import train_test_split
import numpy as np


def main():
	data_set = np.array([
		[0, 1, 0, 1, 0, 1, 0, 1, 0, 1],
		[1, 1, 0, 1, 0, 1, 0, 1, 0, 1],
		[2, 1, 0, 1, 0, 1, 0, 1, 0, 1],
		[3, 1, 0, 1, 0, 1, 0, 1, 0, 1],
		[4, 1, 0, 1, 0, 1, 0, 1, 0, 1],
		[5, 1, 0, 1, 0, 1, 0, 1, 0, 1],
		[6, 1, 0, 1, 0, 1, 0, 1, 0, 1],
		[7, 1, 0, 1, 0, 1, 0, 1, 0, 1],
		[8, 1, 0, 1, 0, 1, 0, 1, 0, 1],
		[9, 1, 0, 1, 0, 1, 0, 1, 0, 1]
	])
	print(data_set.shape)
	label = np.array([0, 1, 0, 1, 0, 1, 0, 1, 0, 1])
	_train_x, _train_y, _test_x, _test_y = train_test_split(
		data_set,
		label,
		test_size=0.1
	)
	print(_train_x.shape)
	print(_test_x.shape)
        """
	>>> (10, 10)
	>>> (9, 10)
	>>> (9,)
	test_sizeを変化させることによって割合を変えることができる。
	今回は0.1指定なので9:1(train:test)
	"""

if __name__ == "__main__":
	main()

```
参考:
[sklearn.model_selection.train_test_split](http://scikit-learn.org/stable/modules/generated/sklearn.model_selection.train_test_split.html)
[scikit-learnでトレーニングデータとテストデータを分割する](http://tt-house.com/2016/02/scikit-learn-split-train-test.html)

Answer

問題を分割して考えるといいです。
- ディレクトリ内のファイルリストを取得する方法
- 7割のファイルを抽出する方法
- ファイルを移動する方法

このうち、二番目だけちょっと詳しく書きます。

7割のファイルを抽出する方法
---
random.sampleを使うとよいでしょう。
```Python
import random

file_to_dir1 = set(random.sample(
    file_list,
    int(len(file_list)*.7)
))
file_to_dir2 = set(file_list) - file_to_dir1
```

7割のファイルを抽出する方法

関連した質問