やりたいこと
現在、4GBの「data.pickle」というファイルがあります。
python
1import pandas as pd 2 3# 読み込み 4df = pd.read_pickle("data.pickle") 5 6# 何かの計算処理 7df = df * input() 8 9# 結果 10print(df.describe())
一例としてのサンプルコードですが、
以上のようにしてファイルを読み込むのですが、このpythonファイルを実行するたび、毎回4GBのファイルを読み込むことになり、これが大変時間がかかります。
最初の一回だけ(時間がかかってもいいので)メモリに読み込んでおいて、
二回目以降はdf
だけすでにメモリに読み込まれた状態のものを使うことができる……みたいな方法はないのでしょうか?
ちなみに上記の「# 何かの計算処理」という箇所は、実際にはかなり長くて、複数の関数を行ったり来たりしているややっこしいコードなので、
できればファイルの読み込み部分df = pd.read_pickle("data.pickle")
だけ変えて処理できる方法を知りたいです。
ご存知の方よろしくお願いします。
環境
Ubuntu 19.04
メモリはGCEを使うので64GBぐらいまで使えます。
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。