質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
Matplotlib

MatplotlibはPythonのおよび、NumPy用のグラフ描画ライブラリです。多くの場合、IPythonと連携して使われます。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

3回答

1176閲覧

.agg()関数で集計したデータフレームから作成した散布図に回帰直線を追加したい。

8960

総合スコア108

Matplotlib

MatplotlibはPythonのおよび、NumPy用のグラフ描画ライブラリです。多くの場合、IPythonと連携して使われます。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2021/11/29 08:09

前提・実現したいこと

以下のようなコードにおいて、X軸は"Speed"のmean値、Y軸に"Angle"のmean値をとった散布図に回帰直線を追加したいです。
sns.regplot()のx,yにどういった形で渡してあげればよいでしょうか?

ご教授の程、よろしくお願い致します。

発生している問題・エラーメッセージ

AttributeError: 'tuple' object has no attribute 'shape'

該当のソースコード

python

1import pandas as pd 2import numpy as np 3import matplotlib.pyplot as plt 4from adjustText import adjust_text 5import seaborn as sns 6pd.options.display.float_format="{:.1f}".format 7#Create a random data frame 8start,end = "2021/4/1","2021/4/30" 9dates = pd.date_range(start=start,end=end,freq="D") 10players = [f"Player{i}"for i in range(1,6)] 11N = 200 12dates = np.random.choice(dates,size=N) 13dates.sort() 14players=np.random.choice(players,size=N) 15df = pd.DataFrame({ 16 "Date": dates, 17 "Player": players, 18 "Speed": np.random.sample(N) * 100.0, 19 "Angle": np.random.sample(N) * 40.0 - 20.0, 20 "Efficiency": np.random.sample(N) * 100.0, 21}) 22#grouping 23dfx = df.groupby("Player").agg({ 24 "Player":"count", 25 "Speed":[np.mean,np.std], 26 "Angle":[np.mean,np.std], 27 "Efficiency":[np.mean], 28}) 29#add average 30dfx.loc['Average', :] = dfx.mean() 31# Create figure 32fig,ax = plt.subplots(figsize=(15,10)) 33dfx[:-1].plot.scatter(x=("Speed","mean"),y=("Angle","mean"),ax=ax) 34#Tag playerlabel and adjust 35x = ("Speed","mean") 36y = ("Angle","mean") 37dfx[:-1].plot.scatter(x=x, y=y, ax=ax,s=100) 38texts=[] 39for i, label in enumerate(dfx[:-1].index): 40 texts.append(ax.annotate( 41 label, ha="center", fontsize=12, 42 xy=(dfx[:-1][x][i], dfx[:-1][y][i]), 43 xytext=(dfx[:-1][x][i], dfx[:-1][y][i]))) 44adjust_text(texts, arrowprops=dict(arrowstyle='->', color='red')) 45#setting 46ax.set_xlabel("Speed") 47ax.set_ylabel("Angle") 48ax.set_xlim(0,100) 49ax.set_ylim(-20,20) 50ax.grid() 51#Linear Regression 52sns.regplot(x=("Speed","mean"),y=("Angle","mean"))

試したこと

https://seaborn.pydata.org/tutorial/regression.html
↑を参照し、regplot()関数にて作成しようとしましたが、xy指定がうまくいかず、上記のエラーが出ました。

補足情報(FW/ツールのバージョンなど)

windows11,python3.9.4,vscode

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答3

0

ベストアンサー

軸ラベルがタプル表示になっているのもナニなので、カラムを単一レベルに直してしまいましょう。

python

1dfy = dfx[:-1].copy() 2dfy.columns = [" ".join(pair) for pair in dfy.columns] 3 4sns.regplot(x="Speed mean", y="Angle mean", data=dfy, ax=ax)

regplot

投稿2021/11/29 09:05

melian

総合スコア20655

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

8960

2021/11/29 09:19

ご回答いただきありがとうございます。出来ました。 初心者の素朴な疑問を一つ...。 sns.regplot(x="Speed mean", y="Angle mean", data=dfy, ax=ax) ↑どのデータを参照するか、はdata=dfyでということは理解できましたが、 なぜ"Speed mean"で、[("Speed","mean")]と同等の扱いができるのでしょうか? 感覚的にですが、"Speed mean"というと、"Speed mean"と一字一句等しいカラム名のカラムを指定しているような気がします。 [()]を使用して、「"Speed"の"mean"だよ」と教えてあげなければならないような気がするもんです...。
melian

2021/11/29 09:23

はい、それが、 dfy.columns = [" ".join(pair) for pair in dfy.columns] なのです。途中に print(dfy) を入れて dfy のカラム名を見て下さい。
melian

2021/11/29 09:25

それと、おそらく将来的には Seaborn が multilevel column に対応するでしょうから、それまでの暫定措置になります。
8960

2021/11/29 09:34

print(dfy)を確認して合点いたしました。 ありがとうございました。
guest

0

snsにはデータのことは何も知らないので列名だけ渡してもダメです。
以下のようにデータを渡しましょう。
なお、表示されたグラフ結果が妥当(正しい)か?は内容を理解していないため不明です。

Python

1df2 = dfx[:-1] 2sns.regplot(x=df2[("Speed","mean")],y=df2[("Angle","mean")])

イメージ説明

投稿2021/11/29 08:33

can110

総合スコア38341

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

8960

2021/11/29 09:21

なるほど、seabornはそもそものdfを知らない、ということですね。 勉強になりました。ありがとうございます!
guest

0

データの配列を渡すために、

python

1sns.regplot(x=dfx[("Speed","mean")], y=dfx[("Angle","mean")])

としてください。

投稿2021/11/29 08:32

kirara0048

総合スコア1399

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

8960

2021/11/29 09:19

ありがとうございます!
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問