Pythonで統計学を学ぶ(6)を参考にさせていただきました。
python
1from statsmodels.stats.multicomp import pairwise_tukeyhsd 2import numpy as np 3 4def tukey_hsd( lst, ind, n ): 5 data_arr = np.hstack( lst ) 6 ind_arr = np.repeat(ind, n) 7 print(pairwise_tukeyhsd(data_arr,ind_arr))
上記のようにTukeyの多重比較比較検定を行うような関数を定義します。
以下、A,B,C,Dを以下のように定義し多重比較検定を実行します。
python
1A = np.array([15,9,18,14,18]) 2B = np.array([13,8,8,12,7]) 3C = np.array([10,6,11,7,12]) 4D = np.array([10,7,3,5,7]) 5 6tukey_hsd( (A,B,C,D), list('ABCD') , 5)
出力
python
1Multiple Comparison of Means - Tukey HSD,FWER=0.05 2============================================== 3group1 group2 meandiff lower upper reject 4---------------------------------------------- 5 A B -5.2 -10.5145 0.1145 False 6 A C -5.6 -10.9145 -0.2855 True 7 A D -8.4 -13.7145 -3.0855 True 8 B C -0.4 -5.7145 4.9145 False 9 B D -3.2 -8.5145 2.1145 False 10 C D -2.8 -8.1145 2.5145 False 11----------------------------------------------
と出力されます。
ここでrejectをFWER=0.05の値を用いて判定していることが分かります。
つまり、group1とgroup2を比較するとき必ずp値を算出していることが分かります。
しかし、私はその算出されているであろうp値を調べる方法が分かりません。
statsmodels.stats.multicomp.pairwise_tukeyhsd
を見る限りはstatsmodels.sandbox.stats.multicomp.TukeyHSDResults
のインスタンスが出力(return)されていて
statsmodels.sandbox.stats.multicomp.TukeyHSDResults
を見る限るにはAttributesに(pvaluesadjusted p-values from the HSD test)と書かれているので、
そのTukeyHSDResults
インスタンスのAttributesの中身を見る方法があればこの問題は解決すると思うのですが。
どのようにすればいいのかここで詰まってしまってしまっています。
分かる方がいれば教えていただけると大変恐縮です。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2019/09/15 06:26 編集
2019/09/15 09:42