質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.46%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

Q&A

解決済

2回答

1224閲覧

【python】dataframeの数値を条件別に当てはめ,列を追加したい

lmk

総合スコア16

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

0グッド

0クリップ

投稿2021/12/20 07:35

編集2021/12/20 08:17

実現したいこと

vscodeを用いてpythonでdataframeの計算をしています.

dataframeの特定の列の数値を条件に当てはめ,新しい列に計算した値を代入したいと考えております.
具体的には,下記の表において,num1×5の値が
・10以下
・10100
・100
200
・200~
の場合に,それぞれ違う数値を新しく作るnum3の列に代入したいです.

a.csv↓
||name1|num1|num2
|:--|:--:|--:|
|0|a|1|3
|1|b|2|4
|2|a|11|5
|3|b|12|6
|4|a|50|7
5|b|51|8|

発生している問題・エラーメッセージ

if文の中でdataframeを用いると,dataframe全体で考えた際の真偽が判断できないためこのようなエラーが出ていると把握しました.
しかし,条件ごとに違う値を入れる方法がわからず,お手数をおかけしますがご教示いただけますと幸いです.

f"The truth value of a {type(self).__name__} is ambiguous. " ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().

該当のソースコード

python

1import pandas as pd 2 3df = pd.read_csv('a.csv') 4A = 5 5 6print(df) 7 8if 0 < A * df['num1'] < 10 : 9 df['num3'] = 5 10elif 10 <= A * df['num1'] < 100 : 11 df['num3'] = 10 *A *df['num2'] 12elif 100 <= A * df['num1'] < 200 : 13 df['num3'] = 15 *A *df['num2'] 14elif 200 <= A * df['num1'] : 15 df['num3'] = 20 *A *df['num2'] 16else : 17 df['num3'] = 'error' 18 19print(df)

補足情報

pandasのバージョンは1.3.4です

追加

追加の質問で恐縮ですが,name1がaの行のみにこの値を代入することは可能でしょうか?
if文の中でdataframeを使わなかった際は,
df['num2'][df['name1'].str.contains('a')]*0+5
のように指定していたのですが,当たり前ですがこのままではうまく回らず…

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

python

1import pandas as pd 2 3df = pd.read_csv('a.csv') 4A = 5 5 6def translate(r): 7 num1, num2 = r['num1'], r['num2'] 8 n = A * num1 9 if 0 < n < 10: 10 return 5 11 elif 10 <= n < 100: 12 return 10 * A * num2 13 elif 100 <= n < 200: 14 return 15 * A * num2 15 elif 200 <= n: 16 return 20 * A * num2 17 else: 18 return 'error' 19 20df['num3'] = df.apply(translate, axis=1) 21 22print(df.to_markdown(index=False))
name1num1num2num3
a135
b24200
a115250
b126300
a507700
b518800

投稿2021/12/20 08:00

編集2021/12/20 08:07
melian

総合スコア19865

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

lmk

2021/12/20 08:19

丁寧にご教示いただきありがとうございます。 追記したものと重なってしまい恐縮なのですが,name1がaの行のみにこの値を代入することは可能でしょうか?
melian

2021/12/20 08:23

はい、可能ですが、name1 が a 以外の場合の num3 はどうしますか?(例えば 0 を入れるなど)
lmk

2021/12/20 08:30

解決することができました。お答えいただきありがとうございました!
guest

0

ベストアンサー

以下のように.applyにて行毎に値を取得、判定して結果値を返すことができます。

Python

1import pandas as pd 2 3df = pd.DataFrame({'name1':list('aaabbb'), 'num1':[1,11,50]*2, 'num2':[3,5,7]*2}) 4A = 5 5 6def func(row): 7 if 0 < A * row['num1'] < 10 : 8 return 5 9 elif 10 <= A * row['num1'] < 100 : 10 return 10 *A *row['num2'] 11 12 return 'error' 13 14df['num3'] = df[df['name1']=='a'].apply(func, axis=1) 15#df['num3'] = 0 # NaNがいやなら必要に応じてデフォルト値を設定 16print(df) 17""" 18 name1 num1 num2 num3 190 a 1 3 5 201 a 11 5 250 212 a 50 7 error 223 b 1 3 NaN 234 b 11 5 NaN 245 b 50 7 NaN 25"""

投稿2021/12/20 07:54

編集2021/12/20 08:20
can110

総合スコア38278

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

lmk

2021/12/20 08:14 編集

丁寧にご教示いただきありがとうございます。 関数とapplyを組み合わせることで実行できるのですね、大変勉強になりました。 追加の質問で恐縮ですが,name1がaの行のみにこの値を代入することは可能でしょうか? if文の中でdataframeを使わなかった際は, df['num2'][df['name1'].str.contains('a')]*0+5 のように指定していたのですが,このままではうまく回らず…
can110

2021/12/20 08:21

回答を修正しました。 apply対象のdfをあらかじめ条件で絞ればよいです。
lmk

2021/12/20 08:30

関数の前に絞ったらよいのですね…! 追加の質問にもかかわらずお答えいただきありがとうございました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.46%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問