前提・実現したいこと
下記のようなpythonのデータフレーム型でa列が正解ラベル(1.0が正解、0.0が不正解)、b列が予測値のデータとします。
各予測値の範囲における正解率の棒グラフを作成したいのですが、集計方法で苦戦してます。
import numpy as np import pandas as pd df = pd.DataFrame(data= [[0.0,0.728463888168335,0.0] ,[1.0,0.027108728885650635,430] ,[1.0,0.5831845998764038,280] ,[0.0,0.03684014081954956,0.0] ,[1.0,0.9906975030899048,100] ,[0.0,0.035909026861190796,0.0] ,[1.0,0.8771868944168091,120] ,[0.0,0.18819177150726318,0.0] ,[0.0,0.7758017778396606,0.0] ,[0.0,0.13000166416168213,0.0] ,[1.0,0.23878684639930725,110] ,[0.0,0.02938440442085266,0.0] ,[0.0,0.13557732105255127,0.0] ,[0.0,0.07250338792800903,0.0] ,[0.0,0.5754911303520203,0.0] ,[0.0,0.3734626770019531,0.0] ,[0.0,0.5296110510826111,0.0] ,[0.0,0.53096604347229,0.0] ,[0.0,0.0026207268238067627,0.0] ,[1.0,0.9533392190933228,560]], columns=['a', 'b', 'c'])
作成したい棒グラフのイメージは下記のような形です。
予測値の範囲で正解ラベルが1.0の割合を表現したいです。
試したこと
Pandasのgroupbyを使用してデータの集計を試みましたが、うまくいきませんでした。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。