python でデータ分析を勉強中です。
CSV から取得したデータを使って各データの割合を出そうとしています。
データ全体を使った割引は出せるのですが、グループ化したデータを使って出すことが出来ません。
データ全体の割合は下記のように出しています。
python
1df = pd.read_csv('data/test.csv',encoding="utf-8") 2df_cond = df.loc[:, 'status'] 3df_cond.value_counts(normalize=True)
データの作りを変えれば value_counts で出せると思いますので、データの作り変え方についてご教授頂けないでしょうか。
元のデータ
no | type | status |
---|---|---|
1 | a | off |
2 | a | on |
3 | a | on |
4 | a | off |
5 | a | off |
6 | b | off |
7 | b | on |
8 | b | off |
9 | b | off |
10 | b | off |
11 | c | off |
期待する戻り値
type | status | % |
---|---|---|
a | on | 40 |
a | off | 60 |
b | on | 20 |
b | off | 80 |
c | off | 100 |
詰まっている箇所
元のデータから下記のデータに変換する処理
a | b | c |
---|---|---|
off | off | off |
on | on | nan |
on | off | nan |
off | off | nan |
off | off | nan |
pythonの勉強をはじめたところでソースが全く思い浮かびません。
よろしくお願い致します。
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2019/12/13 06:04