質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

Q&A

解決済

1回答

4065閲覧

Python:データフレームの各要素に対してある計算をして、列を追加し、計算結果を格納する

pepasuke623

総合スコア55

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

0グッド

0クリップ

投稿2017/01/26 13:24

###前提・実現したいこと
Pandasの 各要素の演算方法ついて質問です。
例えばこんなデータフレームがあるとします。

//Test hoge factors sample1 1 1 sample2 1 1 sample3 2 3
//Dictionary factor1 factor2 cat 1 2 dog 3 4

データフレーム:Testの列:factorsの値をデータフレーム:Dictionaryの要素と照らし合わせて
catかdogかを判定した後に, このデータフレームの末尾にresultという
列名をつけて追加したいと思います。

アウトプットイメージとしては次のとおりです。

hoge factors result sample1 1 1 cat sample2 1 1 cat sample3 2 3 dog

「試したこと」の欄のようにapplyを使って書いてみましたが、
うまく行きません。
上手いを教えていただければと思います。

###発生している問題・エラーメッセージ

なし

###試したこと
applyを使って下のように書いてみましたが,
色々調べてみると applyはSeriesごとの計算しか出来ないみたいです。
(間違ってたらすみません)

python

1import pandas as pd 2 3# 辞書として使うデータフレームを定義する 4df_dict= pd.DataFrame( data=[[1,2],[3,4]], index = ['cat','dog'],columns=['factor1','factor2']).stack() 5 6# 判定用のデータを用意する 7df_test = pd.DataFrame(data=[[1,1],[1,1],[2,3]], index = ['sample1','sample2','sample3'],columns=['hoge','factors']) 8 9# 判定するための関数を定義 10def ident(valu): 11 spec = list(df_dict[df_dict == valu].index) 12 return spec[0][0] 13 14# 判定する 15df_test['result'] = df_test.apply(### ここの書き方が分からないので思ったことが出来ない? ###)

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

キーとする列がどれになるのかわからなかったのですが、df_testのfactorsの要素とdf_dictのfactor1の要素がマッチしていればよいのでしょうか?

上記を前提としているのであれば、こんな書き方でいかがでしょうか。

python

1import pandas as pd 2 3df_dict = pd.DataFrame(data=[[1, 2], [3, 4]], 4 index=['cat', 'dog'], 5 columns=['factor1', 'factor2']) 6df_test = pd.DataFrame(data=[[1, 1], [1, 1], [2, 3]], 7 index=['sample1', 'sample2', 'sample3'], 8 columns=['hoge', 'factors']) 9 10df_test['result'] = df_test['factors'].map( 11 lambda x: df_dict[df_dict['factor1'] == x].index[0])

投稿2017/01/26 23:55

driller

総合スコア720

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

pepasuke623

2017/01/27 21:03

確かにできました! 説明が不足していましたが,キー列はどちらでも大丈夫です. 「lambda x: df_dict[df_dict == x].index[0]」という風にして,手元で試してみました. ありがとうございました!
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問