🎄teratailクリスマスプレゼントキャンペーン2024🎄』開催中!

\teratail特別グッズやAmazonギフトカード最大2,000円分が当たる!/

詳細はこちら
Google Colaboratory

Google Colaboratoryとは、無償のJupyterノートブック環境。教育や研究機関の機械学習の普及のためのGoogleの研究プロジェクトです。PythonやNumpyといった機械学習で要する大方の環境がすでに構築されており、コードの記述・実行、解析の保存・共有などが可能です。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Q&A

解決済

1回答

13852閲覧

【google colab】ディスク容量

jfnflnfl

総合スコア9

Google Colaboratory

Google Colaboratoryとは、無償のJupyterノートブック環境。教育や研究機関の機械学習の普及のためのGoogleの研究プロジェクトです。PythonやNumpyといった機械学習で要する大方の環境がすでに構築されており、コードの記述・実行、解析の保存・共有などが可能です。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

0グッド

1クリップ

投稿2019/11/29 08:46

Google Colabで、会社の売上データの集計をpandasを使って行っています。
会社でG-suiteの契約をしており、会社のアカウントでログインしています。

毎週csv形式のデータを、Google Colabにアップロードし、pandasで加工したあと、csvでダウンロードするという使い方をしています。
ディスクを見るともう少しで一杯になりそうな状態であることに最近、気づきました。

イメージ説明

「!df -h」で、ディスクの状況を調べるとこのような表示がでたのですが、ディスクが一杯になると、売上データの集計ができなくなってしまうため、
1、どんな情報がたまってしまっているのか
2、どうやって綺麗にしたらよいのか
を知りたいと思っています。
調べても全然該当する記事にたどり着けず、困っております。
どなたか分かる方いらっしゃったら助けてください。
よろしくお願いいたします。

Filesystem Size Used Avail Use% Mounted on
overlay 49G 35G 13G 74% /
tmpfs 64M 0 64M 0% /dev
tmpfs 6.4G 0 6.4G 0% /sys/fs/cgroup
tmpfs 6.4G 8.0K 6.4G 1% /var/colab
/dev/sda1 55G 36G 20G 65% /etc/hosts
shm 6.0G 4.0K 6.0G 1% /dev/shm
tmpfs 6.4G 0 6.4G 0% /proc/acpi
tmpfs 6.4G 0 6.4G 0% /proc/scsi
tmpfs 6.4G 0 6.4G 0% /sys/firmware

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

容量を増やしたいのでしたらGoogleドライブをマウントしてファイルを読み書きすればいいです。

イメージ説明

左ペインを表示して「ドライブをマウント」をクリックすると以下のコードのセルが追加されるので実行

python

1from google.colab import drive 2drive.mount('/content/drive')

許可をするとcodeが表示されるのでcolaboratoryに戻ってコピペ実行するとマウントされます。

あとはファイルが表示されているのでパスをコピーでもしてファイルを指定すれば読み書きできます。

python

1# read 2df = pd.read_csv("/content/drive/My Drive/test.csv") 3 4# write 5df.to_csv("/content/drive/My Drive/test.csv")

追記

最初から33.89GBは使用済みです。
これにはOSや開発環境がインストールされています。
イメージ説明

コードは、各アカウント専用の仮想マシンで実行されます。仮想マシンには、システムで定められた有効期限があり、一定期間アイドル状態にある仮想マシンは再利用されます。

https://research.google.com/colaboratory/faq.html

有効期限が切れた仮想マシンは削除されるため次回起動時にはファイルは残っていません。

投稿2019/11/29 11:36

編集2019/12/01 08:57
barobaro

総合スコア1286

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

jfnflnfl

2019/11/30 09:29

ご回答ありがとうございます。 Googleドライブのマウントの方法が理解できました。 私の質問の仕方がわかりにくかったのだと思うのですが、ご相談したかったのは、ディスクの使用量が使っているうちにどんどん増えているのですが、満タンになって使用できなくなる前に、余計なデータを消したいが、どうして増えてしまっているのかわからない状態で、一番最初の状態に戻す方法とかが知りたいと思っています。 初心者すぎて、ディスクの中身がどうなっているのかまったくわからず、的を得ない質問になっており申し訳ないのですが、お力をお貸しください。
barobaro

2019/11/30 10:17

90分・12時間経つとリセットされるという認識なのですが?データ残っていますか? 15GBも使うのでしたら会社のパソコンにPython入れた方が早いと思います。
jfnflnfl

2019/12/01 03:12

ご返信ありがとうございます。 csvでアップロードしたデータは90分・12時間で消えているかと思うのですが、起動時から右上のディスクの棒グラフが黄色くなっており、33GBも使ったいることになっています。 何をすると、このディスクの使用量が増えていくのかがわかっておらず、私がいじるたびに、ゴミのようなものがたまっていって、そのうちディスクが一杯になってしまい、仕事上必要な売上データの集計作業ができなくなってしまうのではないかということを恐れています。
barobaro

2019/12/01 09:12

説明を追記しましたが33.89GBが最初から使用済みです。 次回起動時には仮想マシンがリセットされているためゴミデータも残りません。 たとえるなら毎回新品の買ってきた状態のパソコンを使っている状態です。 いくら使っても次回起動時には新品の買ってきた状態のパソコンに戻っているため データは残っていません。 容量15GBを使い切ってから考えたのでいいと思います。
jfnflnfl

2019/12/02 06:20

ありがとうございました!! よく理解できました!!
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.36%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問