前提・実現したいこと
8GBの.zipファイルをgoogle drive内で解凍し、そのデータをgoogle colab(pro)で読み込んで、pythonによるGPUを使ったディープラーニングの学習をしたいと考えています。
発生している問題・エラーメッセージ
現在データサイエンスコンペであるkaggleに参加していますが、参加しているコンペのデータ・モデルの特徴上、GPUを使った学習でも1エポック5時間以上かかるようなので、google colab proの登録及び、google driveの容量を100GBに拡張しました。
kaggleからAPIを用いてgoogle drive内に.zipファイルをダウンロードをするところまではうまくいったのですが、以下の3つの手法を試しても解凍がうまくいきません。
※なお自分のPCでは正常に解凍が完了することは確認しました。
試したこと
①google colabにおいて、!unzip ZIPファイルPATH -d 解凍先PATH(google drive内)を実行
→google drive内のファイルが多すぎるとのエラー(容量には80GB以上の余裕あり)
②zip extractorを使用
→何度やっても完了直前にgoogle chromeの応答がなくなる(これはintel xeon, メモリ32GBのパソコンで試してみても同様でした)
③自分のPCで解凍してからgoogle driveにコピー
→3日たった現在でも完了しない
補足
.zipファイルには、400万枚の画像と.csvが3ファイル入っています。
.zipファイルのままでも学習を行えるなど、代案があればそれでも構いません。
ご教示いただけると幸いです。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2021/04/23 09:48