pandas 0.24.2
タイトルの通り、pandasでDataFrameの
- 条件に合う行にだけ
- 特定の列に特定の値を
セットしたいとき、どのように書くのが良いでしょうか。
例えば
python
1df.loc[条件, 列名] = 値またはシリーズ 2 3# 例 4df.loc[df.x > 5, 'message'] = 'too many'
と書けるのですが、この書き方は次の3条件を満たすときにエラー(ValueError: cannot set a frame with no defined index and a scalar)となってしまいます。
- dfが0行である
- 新規列の作成である
- 代入するのがシリーズではなく直値である
となると、新規列の作成でないように列の存在を保証すべく次のように
python
1df['message'] = None 2df.loc[df.x > 5, 'message'] = 'too many'
などと書けばエラーもなく目的のことができていることにはなるわけですが、明らかに迂遠でライブラリ設計者の意図に沿っているように思えません。
別の書き方もありますがやはり迂遠⋯
python
1df['message'] = (df.x > 5).replace({True: 'too many', False: None})
より良い書き方があればご教示いただけますでしょうか。
●追記
これがややマシ⋯?
python
1df['message'] = pd.Series('too many', index=df.index).where(df.x > 5)
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2019/12/13 07:10