質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.31%
Pythonista

Pythonistaは、iOS上でPythonプログラミングができる開発アプリです。さらに、Pythonの関数・変数などを自動で補完する便利なコードエディタや、PythonスクリプトをiOS上で多様な形で機能させる各種機能も内包しています。

NumPy

NumPyはPythonのプログラミング言語の科学的と数学的なコンピューティングに関する拡張モジュールです。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

Q&A

解決済

2回答

525閲覧

特定の文字列を含むデータごとにある割合を算出したい

8960

総合スコア108

Pythonista

Pythonistaは、iOS上でPythonプログラミングができる開発アプリです。さらに、Pythonの関数・変数などを自動で補完する便利なコードエディタや、PythonスクリプトをiOS上で多様な形で機能させる各種機能も内包しています。

NumPy

NumPyはPythonのプログラミング言語の科学的と数学的なコンピューティングに関する拡張モジュールです。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

0グッド

0クリップ

投稿2022/06/22 01:44

質問

以下のコードですが、各Typeそれぞれで
・Score1が-30以上30未満
かつ
・Score2が55以上100未満
である割合を求めたいと考えています。

全体の割合は以下のようにできたのですが(自信なし)、
Typeごとに算出するにはどうしたらよいでしょうか?

ご教授の程、よろしくお願いいたします。

該当のソースコード

Python

1import pandas as pd 2import numpy as np 3 4pd.options.display.float_format="{:.2f}".format 5 6type = ["FF","CU","SP","SL","SI","CB"] 7 8N = 1000 9type = np.random.choice(type,size=N) 10df = pd.DataFrame({ 11 "Type":type, 12 "Score1":np.random.sample(N) * 100.0 -50.0, 13 "Score2":np.random.sample(N) * 150 + 0, 14}) 15df_per = (-30<df["Score1"])&(30>df["Score1"])&(55<=df["Score2"])&(100>df["Score2"]) 16df_per.sum() 17 18per = df_per.sum()/df_per.count() 19 20per

補足情報(FW/ツールのバージョンなど)

python3.9、VSCode

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

ベストアンサー

合計(sum)を個数(count)で割るというのは、結局は平均(mean) です。
なので、groupby して平均をとればいいです。

python

1per = df_per.mean() 2type_per = df_per.groupby(df['Type']).mean()

投稿2022/06/22 02:36

bsdfan

総合スコア4899

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

8960

2022/06/22 10:34

確かに!なるほどですね。 ありがとうございました。
guest

0

python

1df_per = df.groupby('Type')\ 2 .apply(lambda x: len(x.query('-30 <= Score1 < 30 and 55 <= Score2 < 100'))/len(x))\ 3 .to_frame('ratio') 4 5print(df_per) 6 7# 8 ratio 9Type 10CB 0.18 11CU 0.14 12FF 0.20 13SI 0.19 14SL 0.20 15SP 0.18

投稿2022/06/22 02:16

編集2022/06/22 02:21
melian

総合スコア21118

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

8960

2022/06/22 10:35

ありがとうございます! 非常に勉強になりました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.31%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問