前提・実現したいこと
RadarChartを作成し個々の能力を評価しようとする段階で、評価するデータを正規化したいと考えております。
以下のようなコードの例でいうと、「POWER」という能力を評価したい場合に、"Speed"というスコアをチーム内(Player130)で正規化し、その点数を10倍することで、110の評価軸でRadarChartにプロットしたいです。
正規化の段階で、エラーが出ており躓いております。
また、#Select Playerと、途中でPlayerを限定して処理していますが、Playerを全員一気に処理する作成する方法、あるいは限定するにしてももっと簡易な限定方法があればお聞きしたいです。
非常にごちゃごちゃして分かり難くなってしまっております。
申し訳ありませんが解読していただけると、です。
ご教授の程、よろしくお願い致します。
該当のソースコード
python
1#Practice RadarChart No.3 with matplotlib normalization ver. 2import pandas as pd 3import matplotlib.pyplot as plt 4import numpy as np 5import japanize_matplotlib 6pd.options.display.float_format="{:.1f}".format 7#Create a random data frame 8start,end = "2021/4/1","2021/4/30" 9dates = pd.date_range(start=start,end=end,freq="D") 10players = [f"Player{i}"for i in range(1,31)] 11N = 1000 12dates = np.random.choice(dates,size=N) 13dates.sort() 14players=np.random.choice(players,size=N) 15df = pd.DataFrame({ 16 "Date": dates, 17 "Player": players, 18 "Speed": np.random.sample(N) * 30.0 + 60.0, 19 "Score1":np.random.sample(N) * 18.0 + 3.0, 20 "Score2":np.random.sample(N) * 50.0 + 40.0, 21 "Angle": np.random.sample(N) * 40.0 - 20.0, 22 "Score3":np.random.sample(N) * 40.0 + 80.0, 23 "Score4":np.random.sample(N) * 40.0 + 80.0, 24 "Score5":np.random.sample(N) * 40.0 - 40.0, 25 "Time": np.random.sample(N) * 0.03 + 0.15, 26 "Score6":np.random.sample(N) * 7.0 + 15.0, 27}) 28#mile to km/h 29df[["Speed","Score6"]]*=1.60934 30#add new data 31df["Efficiency"]=df["Speed"]/df["Score6"] 32#definition 90percentile and angle percent 33def percentile(n): 34 def percentile_(x): 35 return np.percentile(x, n) 36 percentile_.__name__ = '%sth' % n 37 return percentile_ 38 39def angle_per(angle): 40 return 100*angle[(angle>=4.0)&(angle<16.0)].count()/angle.count() 41#grouping 42dfx = df.groupby("Player").agg({ 43 "Player":"count", 44 "Speed":[np.mean,percentile(90)], 45 "Score1":[np.mean], 46 "Score2":[np.mean], 47 "Angle":[np.mean,angle_per], 48 "Score3":[np.mean,percentile(90)], 49 "Score4":[np.mean], 50 "Score5":[np.mean], 51 "Time":[np.mean], 52 "Score6":[np.mean], 53 "Efficiency":[np.mean], 54}) 55#add average 56dfx.loc['Average', :] = dfx.mean() 57#Join columns 58dfx.columns = [" ".join(pair) for pair in dfx.columns] 59# Define indicators 60 61# 正規化 62from sklearn import preprocessing 63# POWER 64power = dfx["Speed 90th"] 65mm = preprocessing.MinMaxScaler() 66power_nor= mm.fit_transform(power) # 正規化 67power_s = power_nor*10 # Maxを10に変更 68# Select player 69power_s1 = power_s["Player1"] 70 71labels = ["POWER","Score2","Score3", "Score4","Score5"] 72values = [power_s1, 6, 7, 8,4] #※ほかの値は確認用のサンプル。途中です。 73 74def plot_polar(labels, values, imgname): 75 angles = np.linspace(0, 2 * np.pi, len(labels) + 1, endpoint=True) 76 values = np.concatenate((values, [values[0]])) # 閉じた多角形にする 77 fig = plt.figure(figsize=(5,10)) 78 ax = fig.add_subplot(1,1,1,polar=True) 79 ax.plot(angles, values, 'o-') # 外枠 80 ax.fill(angles, values, alpha=0.25) # 塗りつぶし 81 ax.set_thetagrids(angles[:-1] * 180 / np.pi, labels) # 軸ラベル 82 ax.set_title("Player1") # グラフタイトル 83 ax.set_rgrids([]) # 円形の目盛線を消す 84 ax.spines['polar'].set_visible(False) # 一番外側の円を消す 85 ax.set_theta_zero_location("N") # 始点を上(北)に変更 86 ax.set_theta_direction(-1) # 時計回りに変更(デフォルトの逆回り) 87 rgrids = [0, 2, 4, 6, 8, 10] # メモリ軸の生成 88 for grid_value in rgrids: # 多角形の目盛線を引く 89 grid_values = [grid_value] * (len(labels)+1) 90 ax.plot(angles, grid_values, color="gray", linewidth=0.5) 91 for t in rgrids: # メモリの値を表示する 92 ax.text(x=0, y=t, s=t) # xが偏角、yが絶対値でテキストの表示場所が指定される 93 ax.set_rlim(0, 10) # rの範囲を指定 94 95plot_polar(labels, values, "radar.png")
発生している問題・エラーメッセージ
ValueError: Expected 2D array, got 1D array instead: array=[136.37997716 136.94385752 136.55590828 136.6530321 139.69316103 138.04583899 140.35552265 138.44361077 132.75867322 140.92062068 140.99898822 140.38569291 137.23800889 142.95484464 134.46970646 140.45353869 136.65617669 137.83130657 139.79584669 141.44494776 138.84525133 137.89494095 141.18510855 140.13147669 140.12502832 142.64264255 138.60472735 130.73014156 135.33320749 140.37908007 138.49502883]. Reshape your data either using array.reshape(-1, 1) if your data has a single feature or array.reshape(1, -1) if it contains a single sample.
試したこと
一次元配列が取得されているので二次元配列に修正してください、とのことだと思うのですが、理解できません。
print(power)で確認すると、"Player"と"Speed 90th"の値を含む二次元データのような気がするのですが。
自分の二次元配列に関する解釈が間違っていると思いますので、併せてご教授いただけましたら嬉しいです。
補足情報(FW/ツールのバージョンなど)
windows11,python3.9.4,vscode
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2021/12/23 01:36