エクセルファイルに入っている数量データを機械学習で予測するために、データの前処理を行っています。
その際、以下のように、Excelファイルからインポートしたデータを順に処理しています。
import pandas input_sheet_df_1 = pandas.ExcelFile(...) # エクセルファイルの読み込み input_sheet_df_2 = # input_sheet_df_1に対して、解析に使う変数の抽出 input_sheet_df_3 = # input_sheet_df_2に対して、変数名の変更 input_sheet_df_4 = # input_sheet_df_3に対して、変数内の演算
ただ、このようにデータを順番に処理すると、変数名がどんどん増えていき、
途中処理を追加した時に番号管理ができなくなってしまいます(変数名称を10、20とすればできなくはないですが、、、)。
また、各データの値も保持したいので、すべてをinput_sheet_dfに上書きすることもできません。
このような場合、どう変数を取り扱っていったらいいでしょうか?
(可能なら、一部の途中処理をスキップできるとさらにうれしいです。)
回答3件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2018/06/08 23:56