実現したいこと
初歩的な質問で恐縮です。
以下のようなDataFrameについて、「品物」列のカテゴリ別の標準化をしたスコアを
一番右の列に加えたいのですが、やり方が分からず投稿させて頂きました。
該当のソースコード
df = pd.DataFrame({ '売上': [ 3069, 8390, 6378, 6236, 4486, 2234, 9482, 4938, 3948], '品物': ['A', 'A', 'A', 'B', 'B', 'C', 'C', 'C', 'C'] })
試したこと
列全体の標準化は以下の式で出せたのですが、「品物」カテゴリ内での標準化した数値を右の列に加えたい場合はどのようなコードを書くのが適切でしょうか?
df['売上_標準化'] = (df['売上'] - df['売上'].mean()) / df['売上'].std()
基本的な内容で恐れ入りますが、調べても中々分からなかったのでご質問させて頂きました。
何卒よろしくお願いいたします。
欲しい出力結果
出力結果としては以下のようなDataFrameを出したいと思っています。
新たに「標準化した数値」というカラムを作り、その中に「品物」カテゴリ内で標準化した値が入るようにしたいです。
例:1行目の売上「3069」の行には、品物「A」の中で標準化した値が入る
(teratailで何故か画像のアップロードが出来なかったので、以下にリンクを貼ります)
https://imgur.com/pdxigO4
回答1件
あなたの回答
tips
プレビュー