質問するログイン新規登録

質問編集履歴

2

コードが間違っていたので訂正しました。

2019/04/01 16:52

投稿

magi201903
magi201903

スコア29

title CHANGED
File without changes
body CHANGED
@@ -49,9 +49,9 @@
49
49
 
50
50
  そこで、最上位のマイドライブフォルダ直下には計10個のフォルダとファイルしか置いていません。その状態でコードを実行しましたが、症状は改善されませんでした。
51
51
 
52
- ■一気に12500ファイルに順番にアクセスするコードが駄目なのかと思い、ファイルを100個ずつの束にして、1束ずつアクセスするように、コードを下記のように書き直しました。しかし、失敗しました。
52
+ ■一気に12500ファイルに順番にアクセスするコードが駄目なのかと思い、ファイルを1個ずつの束にして、1束ずつアクセスするように、コードを下記のように書き直しました。しかし、失敗しました。
53
53
 
54
- ただし、1フォルダ当たりの中身をファイル500個に減らして(つまり2フォルダでファイル1000個)、下記のコードを実行すると成功しました。(ちなみに、最初に書いたコードを実行すると失敗。つまり、100個ずつの束にすることに、意味はあったのかなと考えています)
54
+ ただし、1フォルダ当たりの中身をファイル500個に減らして(つまり2フォルダでファイル1000個)、下記のコードを実行すると成功しました。(ちなみに、最初に書いたコードを実行すると失敗。つまり、1個ずつの束にすることに、意味はあったのかなと考えています)
55
55
 
56
56
  ```python
57
57
  from google.colab import drive
@@ -74,7 +74,7 @@
74
74
 
75
75
  for label_type in ['neg', 'pos']:
76
76
  dir_name = os.path.join(train_dir, label_type)
77
- #dir_nameを100fileずつのbatchに加工します
77
+ #dir_nameを1fileずつのbatchに加工します
78
78
  result = list(split_list(os.listdir(dir_name), 1))
79
79
  for x in result:
80
80
  for fname in x:

1

3段落目に加筆。「コードをどう改造すれば良いですか?」と加えました。

2019/04/01 16:52

投稿

magi201903
magi201903

スコア29

title CHANGED
File without changes
body CHANGED
@@ -3,7 +3,7 @@
3
3
 
4
4
  具体的に言うと、IMDb(Internet Movie Database)データをテキストとしてダウンロードして展開し、個々の映画レビューを文字列のリスト(texts)にまとめ、映画レビューのラベル(肯定的、否定的)をlabelsリストにまとめます。
5
5
 
6
- しかし、参考書に書いてある通りにコードを実行するのですが、エラーが出るか、実行中状態が続き、完了しません。同じ操作を何度か実行するのですが、完了はしません。
6
+ しかし、参考書に書いてある通りにコードを実行するのですが、エラーが出るか、実行中状態が続き、完了しません。同じ操作を何度か実行するのですが、完了はしません。コードをどう改造すれば良いですか?
7
7
 
8
8
  恐らく参照するファイルが25000個(1フォルダに12500個。それが2フォルダあります)あり、数が膨大なためだと思います。GoogleColaboratoryのよくある質問に「Google ドライブのオペレーションは、フォルダ内のファイル数やサブフォルダ数が増えすぎるとタイムアウトすることがあります。」と書いてありました。
9
9