質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Matplotlib

MatplotlibはPythonのおよび、NumPy用のグラフ描画ライブラリです。多くの場合、IPythonと連携して使われます。

NumPy

NumPyはPythonのプログラミング言語の科学的と数学的なコンピューティングに関する拡張モジュールです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

Q&A

解決済

1回答

1146閲覧

あるデータを正規化してRadarChartにプロットしたい。

8960

総合スコア108

Matplotlib

MatplotlibはPythonのおよび、NumPy用のグラフ描画ライブラリです。多くの場合、IPythonと連携して使われます。

NumPy

NumPyはPythonのプログラミング言語の科学的と数学的なコンピューティングに関する拡張モジュールです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

0グッド

0クリップ

投稿2021/12/21 13:31

編集2021/12/21 14:36

前提・実現したいこと

RadarChartを作成し個々の能力を評価しようとする段階で、評価するデータを正規化したいと考えております。

以下のようなコードの例でいうと、「POWER」という能力を評価したい場合に、"Speed"というスコアをチーム内(Player130)で正規化し、その点数を10倍することで、110の評価軸でRadarChartにプロットしたいです。

正規化の段階で、エラーが出ており躓いております。
また、#Select Playerと、途中でPlayerを限定して処理していますが、Playerを全員一気に処理する作成する方法、あるいは限定するにしてももっと簡易な限定方法があればお聞きしたいです。

非常にごちゃごちゃして分かり難くなってしまっております。
申し訳ありませんが解読していただけると、です。

ご教授の程、よろしくお願い致します。

該当のソースコード

python

1#Practice RadarChart No.3 with matplotlib normalization ver. 2import pandas as pd 3import matplotlib.pyplot as plt 4import numpy as np 5import japanize_matplotlib 6pd.options.display.float_format="{:.1f}".format 7#Create a random data frame 8start,end = "2021/4/1","2021/4/30" 9dates = pd.date_range(start=start,end=end,freq="D") 10players = [f"Player{i}"for i in range(1,31)] 11N = 1000 12dates = np.random.choice(dates,size=N) 13dates.sort() 14players=np.random.choice(players,size=N) 15df = pd.DataFrame({ 16 "Date": dates, 17 "Player": players, 18 "Speed": np.random.sample(N) * 30.0 + 60.0, 19 "Score1":np.random.sample(N) * 18.0 + 3.0, 20 "Score2":np.random.sample(N) * 50.0 + 40.0, 21 "Angle": np.random.sample(N) * 40.0 - 20.0, 22 "Score3":np.random.sample(N) * 40.0 + 80.0, 23 "Score4":np.random.sample(N) * 40.0 + 80.0, 24 "Score5":np.random.sample(N) * 40.0 - 40.0, 25 "Time": np.random.sample(N) * 0.03 + 0.15, 26 "Score6":np.random.sample(N) * 7.0 + 15.0, 27}) 28#mile to km/h 29df[["Speed","Score6"]]*=1.60934 30#add new data 31df["Efficiency"]=df["Speed"]/df["Score6"] 32#definition 90percentile and angle percent 33def percentile(n): 34 def percentile_(x): 35 return np.percentile(x, n) 36 percentile_.__name__ = '%sth' % n 37 return percentile_ 38 39def angle_per(angle): 40 return 100*angle[(angle>=4.0)&(angle<16.0)].count()/angle.count() 41#grouping 42dfx = df.groupby("Player").agg({ 43 "Player":"count", 44 "Speed":[np.mean,percentile(90)], 45 "Score1":[np.mean], 46 "Score2":[np.mean], 47 "Angle":[np.mean,angle_per], 48 "Score3":[np.mean,percentile(90)], 49 "Score4":[np.mean], 50 "Score5":[np.mean], 51 "Time":[np.mean], 52 "Score6":[np.mean], 53 "Efficiency":[np.mean], 54}) 55#add average 56dfx.loc['Average', :] = dfx.mean() 57#Join columns 58dfx.columns = [" ".join(pair) for pair in dfx.columns] 59# Define indicators 60 61# 正規化 62from sklearn import preprocessing 63# POWER 64power = dfx["Speed 90th"] 65mm = preprocessing.MinMaxScaler() 66power_nor= mm.fit_transform(power) # 正規化 67power_s = power_nor*10 # Maxを10に変更 68# Select player 69power_s1 = power_s["Player1"] 70 71labels = ["POWER","Score2","Score3", "Score4","Score5"] 72values = [power_s1, 6, 7, 8,4] #※ほかの値は確認用のサンプル。途中です。 73 74def plot_polar(labels, values, imgname): 75 angles = np.linspace(0, 2 * np.pi, len(labels) + 1, endpoint=True) 76 values = np.concatenate((values, [values[0]])) # 閉じた多角形にする 77 fig = plt.figure(figsize=(5,10)) 78 ax = fig.add_subplot(1,1,1,polar=True) 79 ax.plot(angles, values, 'o-') # 外枠 80 ax.fill(angles, values, alpha=0.25) # 塗りつぶし 81 ax.set_thetagrids(angles[:-1] * 180 / np.pi, labels) # 軸ラベル 82 ax.set_title("Player1") # グラフタイトル 83 ax.set_rgrids([]) # 円形の目盛線を消す 84 ax.spines['polar'].set_visible(False) # 一番外側の円を消す 85 ax.set_theta_zero_location("N") # 始点を上(北)に変更 86 ax.set_theta_direction(-1) # 時計回りに変更(デフォルトの逆回り) 87 rgrids = [0, 2, 4, 6, 8, 10] # メモリ軸の生成 88 for grid_value in rgrids: # 多角形の目盛線を引く 89 grid_values = [grid_value] * (len(labels)+1) 90 ax.plot(angles, grid_values, color="gray", linewidth=0.5) 91 for t in rgrids: # メモリの値を表示する 92 ax.text(x=0, y=t, s=t) # xが偏角、yが絶対値でテキストの表示場所が指定される 93 ax.set_rlim(0, 10) # rの範囲を指定 94 95plot_polar(labels, values, "radar.png")

発生している問題・エラーメッセージ

ValueError: Expected 2D array, got 1D array instead: array=[136.37997716 136.94385752 136.55590828 136.6530321 139.69316103 138.04583899 140.35552265 138.44361077 132.75867322 140.92062068 140.99898822 140.38569291 137.23800889 142.95484464 134.46970646 140.45353869 136.65617669 137.83130657 139.79584669 141.44494776 138.84525133 137.89494095 141.18510855 140.13147669 140.12502832 142.64264255 138.60472735 130.73014156 135.33320749 140.37908007 138.49502883]. Reshape your data either using array.reshape(-1, 1) if your data has a single feature or array.reshape(1, -1) if it contains a single sample.

試したこと

一次元配列が取得されているので二次元配列に修正してください、とのことだと思うのですが、理解できません。
print(power)で確認すると、"Player"と"Speed 90th"の値を含む二次元データのような気がするのですが。
自分の二次元配列に関する解釈が間違っていると思いますので、併せてご教授いただけましたら嬉しいです。

補足情報(FW/ツールのバージョンなど)

windows11,python3.9.4,vscode

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

sklearn.preprocessing.MinMaxScaler — scikit-learn 1.0.1 documentation を眺めてみますと、列単位で正規化を行う様です。なので、power を転置(transpose)して mm.fit_transform() に渡す必要があります。

python

1# POWER 2power = dfx["Speed 90th"].values[:,None] # transpose 3mm = preprocessing.MinMaxScaler(feature_range=(0, 10)) # Maxを10に変更 4power_nor = mm.fit_transform(power) # 正規化 5# 元の pandas.Series 型インスタンスに戻す 6power_s = pd.Series(power_nor[:,0], index=dfx["Speed 90th"].index) 7# Select player 8power_s1 = power_s["Player1"]

なお、前述の API ドキュメントには以下の様に書かれていますので、

The transformation is given by:

X_std = (X - X.min(axis=0)) / (X.max(axis=0) - X.min(axis=0)) X_scaled = X_std * (max - min) + min```

where min, max = feature_range.

この様にしても同じ結果になります。

python

1power = dfx["Speed 90th"] 2power_s = 10 * (power - power.min()) / (power.max() - power.min())

投稿2021/12/21 15:45

編集2021/12/21 16:05
melian

総合スコア19703

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

8960

2021/12/23 01:36

@melian さん 出来ました。 ご回答いただきありがとうございました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問