🎄teratailクリスマスプレゼントキャンペーン2024🎄』開催中!

\teratail特別グッズやAmazonギフトカード最大2,000円分が当たる!/

詳細はこちら
pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

Q&A

解決済

1回答

802閲覧

Pandasでカラム間の計算

jojaku

総合スコア4

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

0グッド

0クリップ

投稿2021/01/22 05:00

編集2021/01/22 05:04

前提・実現したいこと

Pandasでデータフレームの操作を勉強しています。

下記のデータフレームで例えると
利客数に対してアウターの購入率を出したければ
df['アウター'] / df['来客'] * 100 もしくは
df.iloc[:,2] / df.iloc[:,1] * 100 で出せます。

これを1:1ではなく、来客:各カテゴリで計算する方法がわかりません。
アウターだけでなくトップス・ボトムス・インナー・シューズもまとめて購入率を出したいです。

該当のソースコード

pandas

1import pandas as pd 2 3df = pd.DataFrame({'店舗':['shop1', 'shop2', 'shop3', 'shop4', 'shop5', 'shop6', 'shop7', 'shop8', 'shop9', 'shop10'], 4 '来客':[45, 132, 78, 154, 39, 57, 83, 117, 96, 44], 5 'アウター':[0, 4, 1, 5, 0, 1, 0, 8, 2, 0], 6 'トップス':[3, 11, 5, 18, 1, 2, 4, 15, 12, 3], 7 'ボトムス':[1, 8, 3, 12, 1, 3, 8, 10, 8, 0], 8 'インナー':[3, 7, 10, 8, 2, 5, 6, 1, 0, 5], 9 'シューズ':[0, 2, 0, 5, 0, 1, 1, 3, 0, 0]}) 10 11df.set_index('店舗') 12df.iloc[:,2] / df.iloc[:,1] * 100

試したこと

アウターのカラム以降を指定すればいいのかと思い
df.iloc[:,2:] / df.iloc[:,1] * 100
を試しましたが、値が全てNaNのデータフレームが出力されてしまいました。

ご教示のほどよろしくお願いいたします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

tiitoi

2021/01/22 05:04

「来客:各カテゴリで計算」とは結果としてどのような DataFrame が得られることを期待していますか?
jojaku

2021/01/22 05:12

元のデータフレームの購入数が、購入率に置き換わっているものを出力したいです
guest

回答1

0

ベストアンサー

df.divを使えば良さそうです。

python3

1import pandas as pd 2 3df = pd.DataFrame({'店舗':['shop1', 'shop2', 'shop3', 'shop4', 'shop5', 'shop6', 'shop7', 'shop8', 'shop9', 'shop10'], 4 '来客':[45, 132, 78, 154, 39, 57, 83, 117, 96, 44], 5 'アウター':[0, 4, 1, 5, 0, 1, 0, 8, 2, 0], 6 'トップス':[3, 11, 5, 18, 1, 2, 4, 15, 12, 3], 7 'ボトムス':[1, 8, 3, 12, 1, 3, 8, 10, 8, 0], 8 'インナー':[3, 7, 10, 8, 2, 5, 6, 1, 0, 5], 9 'シューズ':[0, 2, 0, 5, 0, 1, 1, 3, 0, 0]}) 10 11df = df.set_index('店舗') 12df_cal = df.div(df["来客"], axis=0).drop("来客", axis=1)*100 13print(df_cal) 14# アウター トップス ボトムス インナー シューズ 15# 店舗 16# shop1 0.000000 6.666667 2.222222 6.666667 0.000000 17# shop2 3.030303 8.333333 6.060606 5.303030 1.515152 18# shop3 1.282051 6.410256 3.846154 12.820513 0.000000 19# shop4 3.246753 11.688312 7.792208 5.194805 3.246753 20# shop5 0.000000 2.564103 2.564103 5.128205 0.000000 21# shop6 1.754386 3.508772 5.263158 8.771930 1.754386 22# shop7 0.000000 4.819277 9.638554 7.228916 1.204819 23# shop8 6.837607 12.820513 8.547009 0.854701 2.564103 24# shop9 2.083333 12.500000 8.333333 0.000000 0.000000 25# shop10 0.000000 6.818182 0.000000 11.363636 0.000000

投稿2021/01/22 05:15

jeanbiego

総合スコア3966

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

jojaku

2021/01/22 06:04

まさしくやりたかったことです!ありがとうございます!
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.36%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問