前提・実現したいこと
最近Python等で統計の勉強を始めた大学院生です。
大学の講義で「相関係数が0の母集団から得られた標本(n=30)の相関係数から計算されたt統計量が自由度n-2のt分布に従うか確認する」という課題があり、
母集団から標本を10000回抽出し、各標本から相関係数を求めてヒストグラムを描画する。次に自由度n-2のt分布も描画しておよそヒストグラムと一致するか確認するという流れのプログラムをpython.3.0のjupyter notebookにて書いておりますが、Pearsonの積率相関係数を計算する際にエラーが出てしまい、解決法を教えていただきたく思います。「r」が赤文字になっているので原因だと思うのですが、なぜ赤文字になるのかわからないという状況です。よろしくお願いいたします。
発生している問題・エラーメッセージ
File "<ipython-input-114-137ff88773f7>", line 9 r,p = stats.pearsonr(df.x, df.y) #sampledのx列とy列のPearsonの積率相関係数を計算 ^ SyntaxError: invalid character in identifier
該当のソースコード
python3
1df = pd.read_csv("https://bit.ly/2TVx6nq") #インターネット経由で相関係数がほぼ0な母集団を読み込み 2import scipy.stats as stats #scipyパッケージのstatsモジュールをstatsで読み込み 3from scipy.stats import pearsonr #相関係数の計算 4import numpy as np #numpyパッケージをnpで読み込み 5SAMPLE_NUM = 100000 6n = 30 7t_value = [] #t統計量を保存しておくための配列 8for i in range(SAMPLE_NUM): #以下をSAMPLE_NUM回繰り返すfor文 9 sampled = df.sample(n = 30) #DataFrameからランダムに30個の行を取り出す 10 r,p = stats.pearsonr(df.x, df.y) #sampledのx列とy列のPearsonの積率相関係数を計算 11 #r:相関係数 p:p値 12 t_value.append(r) #配列に追加 13 14plt.hist(t_values, density=True) # 得られたSAMPLE_NUM 個のt統計量のヒストグラムを描画する. 15# t分布の描画 16xs = np.arange(-10, 10, 0.001) 17ys = stats.t.pdf(xs, df=n-2) 18plt.plot(xs, ys)
試したこと
rを別の変数に置き換える。そもそもstats.pearsonrを使うことが正しいかほかの構文も確認。
補足情報(FW/ツールのバージョンなど)
ここにより詳細な情報を記載してください。

回答1件
あなたの回答
tips
プレビュー
下記のような回答は推奨されていません。
このような回答には修正を依頼しましょう。
また依頼した内容が修正された場合は、修正依頼を取り消すようにしましょう。
2021/06/21 11:08