前提・実現したいこと
pandas のデータフレームに取り込んだ任意のデータについて、任意の列計算を行い、
別のデータフレームに変換して、最終的にexcelに張り付けるなどを汎用的に行いたいと考えています。
発生している問題
そのため、下記の図のようなイメージで動くメソッドを作りたいのですが、
パラメータ(自分のイメージでは、ordered_dict)に渡した名称を使って、dataframeを作る段になって、
どうやったらdfが生成できるかのイメージがわかず困っています。どのようにしたら、カラム名を使った
列計算をした形でデータフレームが初期化できるでしょうか。お手数をおかけいたしますが、
ご回答いただけましたら幸甚です。
補足情報(FW/ツールのバージョンなど)
python 3.6
pandas 1.0
問題の背景・回答
入力・出力は?→
入力:test_dfと、新しく作るデータフレームの列名と、任意の列計算するための計算式
出力:新しいデータフレーム
pythonで普通に計算式を書いては?→
計算式を直接プログラムに書ければそれでよいのですが、下記2点の理由でできれば避けたいということです。
・計算式が頻繁に変わるので、コードの中に入れると、配布用にexe化することが現実的でなくなる。
・pythonプログラムを書いたことない人でも(列名さえわかれば)設定できるようにしたい。
(Excelしか触ったことないような人がパラメータを設定するくらいを想定しています。)
dfの作り方が分からない?→
Dataframeの作り方は標準的な生成方法はわかります。(が、それだとできないのでは?と思っています。)
回答2件
あなたの回答
tips
プレビュー