質問編集履歴

コードが間違っていたので訂正しました。

2019/04/01 16:52

投稿

magi201903

スコア29

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -49,9 +49,9 @@
 そこで、最上位のマイドライブフォルダ直下には計１０個のフォルダとファイルしか置いていません。その状態でコードを実行しましたが、症状は改善されませんでした。
-■一気に12500ファイルに順番にアクセスするコードが駄目なのかと思い、ファイルを１００個ずつの束にして、１束ずつアクセスするように、コードを下記のように書き直しました。しかし、失敗しました。
+■一気に12500ファイルに順番にアクセスするコードが駄目なのかと思い、ファイルを１個ずつの束にして、１束ずつアクセスするように、コードを下記のように書き直しました。しかし、失敗しました。
-ただし、１フォルダ当たりの中身をファイル500個に減らして（つまり２フォルダでファイル1000個）、下記のコードを実行すると成功しました。（ちなみに、最初に書いたコードを実行すると失敗。つまり、１００個ずつの束にすることに、意味はあったのかなと考えています）
+ただし、１フォルダ当たりの中身をファイル500個に減らして（つまり２フォルダでファイル1000個）、下記のコードを実行すると成功しました。（ちなみに、最初に書いたコードを実行すると失敗。つまり、１個ずつの束にすることに、意味はあったのかなと考えています）
 ```python
 from google.colab import drive
@@ -74,7 +74,7 @@
 for label_type in ['neg', 'pos']:
     dir_name = os.path.join(train_dir, label_type)
-    #dir_nameを100fileずつのbatchに加工します
+    #dir_nameを1fileずつのbatchに加工します
     result = list(split_list(os.listdir(dir_name), 1))
     for x in result:
         for fname in x:

317 1326 1491

３段落目に加筆。「コードをどう改造すれば良いですか？」と加えました。

2019/04/01 16:52

投稿

magi201903

スコア29

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -3,7 +3,7 @@
 具体的に言うと、IMDb(Internet Movie Database)データをテキストとしてダウンロードして展開し、個々の映画レビューを文字列のリスト(texts)にまとめ、映画レビューのラベル（肯定的、否定的）をlabelsリストにまとめます。
-しかし、参考書に書いてある通りにコードを実行するのですが、エラーが出るか、実行中状態が続き、完了しません。同じ操作を何度か実行するのですが、完了はしません。
+しかし、参考書に書いてある通りにコードを実行するのですが、エラーが出るか、実行中状態が続き、完了しません。同じ操作を何度か実行するのですが、完了はしません。コードをどう改造すれば良いですか？
 恐らく参照するファイルが25000個(1フォルダに12500個。それが２フォルダあります）あり、数が膨大なためだと思います。GoogleColaboratoryのよくある質問に「Google ドライブのオペレーションは、フォルダ内のファイル数やサブフォルダ数が増えすぎるとタイムアウトすることがあります。」と書いてありました。

317 1326 1491