2つの列にある値の平均を別のデーターフレームに元データーフレーム列分
平均を順次して貼付る方法を教えてください。
2つの列にある値の平均を別のデーターフレームに列の追加をすることは出来たのですが、
それを順次元とデーターフレームにある列分すべてを左から右に順番に平均を出して
別のデーターフレームに追加していく方法が分かりません。
y=1、y=0+yとか無理やりやって1行だけ追加することが出来たのですが
そこから前に進めません。
宜しくお願い致します。
df_H2 = pd.DataFrame({'50': [860,950,1040,1140,1220,1390,1450],
'100': [880,970,1060,1160,1250,1450,1550],
'150': [890,1000,1080,1220,1330,1550,1650],
'200': [890,1030,1120,1270,1390,1650,1740],
'250': [910,1040,1150,1310,1470,1740,1830]},
index=['10', '20', '30','40','60','80','100'] )
df_H2 = df_H2.reset_index()
df_index = df_H2.iloc[:,[0]]
aves = []
for x,data in df_H2.iterrows():
x +=0
if x ==7:
break
ave = (df_H2.iloc[x,y]+df_H2.iloc[x,y+1])/2 aves.append(ave) y=1 y =0+y
df_index[y]=aves
_df = df_index
_df
気になる質問をクリップする
クリップした質問は、後からいつでもMYページで確認できます。
またクリップした質問に回答があった際、通知やメールを受け取ることができます。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
回答2件
0
解決済になっていますが、参考として別解を書いておきます。
numpyの関数np.convolve()
、あるいはscipyの関数scipy.ndimage.convolve()
を使うと簡単かつ高速に計算できます。
この関数は、配列[a, b, c, d]
と重み配列[q, p]
を渡すと、[ap+bq, bp+cq, cp+dq]
という配列を返します。このとき重み配列[q, p]
に[0.5, 0.5]
を代入すれば、配列の隣り合った数の平均が求まります。
python
1In [1]: import numpy as np 2 ...: import pandas as pd 3 ...: import scipy.ndimage 4 5In [2]: df_H2 = pd.DataFrame({'50': [860, 950, 1040, 1140, 1220, 1390, 1450], 6 ...: '100': [880, 970, 1060, 1160, 1250, 1450, 1550], 7 ...: '150': [890, 1000, 1080, 1220, 1330, 1550, 1650], 8 ...: '200': [890, 1030, 1120, 1270, 1390, 1650, 1740], 9 ...: '250': [910, 1040, 1150, 1310, 1470, 1740, 1830]}, 10 ...: index=['10', '20', '30', '40', '60', '80', '100']) 11 ...: df_H2 12Out[2]: 13 50 100 150 200 250 1410 860 880 890 890 910 1520 950 970 1000 1030 1040 1630 1040 1060 1080 1120 1150 1740 1140 1160 1220 1270 1310 1860 1220 1250 1330 1390 1470 1980 1390 1450 1550 1650 1740 20100 1450 1550 1650 1740 1830 21 22In [3]: df_H2.apply(np.convolve, result_type='expand', v=[.5, .5], mode='valid', axis=1) 23Out[3]: 24 0 1 2 3 2510 870.0 885.0 890.0 900.0 2620 960.0 985.0 1015.0 1035.0 2730 1050.0 1070.0 1100.0 1135.0 2840 1150.0 1190.0 1245.0 1290.0 2960 1235.0 1290.0 1360.0 1430.0 3080 1420.0 1500.0 1600.0 1695.0 31100 1500.0 1600.0 1695.0 1785.0 32 33In [4]: pd.DataFrame(scipy.ndimage.convolve(df_H2, [[.5, .5]])[:, :-1], index=df_H2.index) 34Out[4]: 35 0 1 2 3 3610 870 885 890 900 3720 960 985 1015 1035 3830 1050 1070 1100 1135 3940 1150 1190 1245 1290 4060 1235 1290 1360 1430 4180 1420 1500 1600 1695 42100 1500 1600 1695 1785
応用していろいろなやり方がありますので以下に列挙します。
python
1df_H2.apply(np.convolve, result_type='expand', v=[.5, .5], mode='valid', axis=1) 2df_H2.apply(np.convolve, raw=True, v=[.5, .5], mode='same', axis=1).iloc[:, 1:] 3pd.DataFrame(np.convolve(df_H2.to_numpy().ravel(), [.5, .5], 'same').reshape(-1, 5)[:, 1:], index=df_H2.index) 4pd.DataFrame(scipy.ndimage.convolve(df_H2, [[.5, .5]])[:, :-1], index=df_H2.index) 5df_H2.apply(scipy.ndimage.convolve, result_type='expand', weights=[.5, .5], axis=1).iloc[:, 1:] 6df_H2.apply(scipy.ndimage.convolve, raw=True, weights=[.5, .5], axis=1).iloc[:, 1:] 7pd.DataFrame(scipy.ndimage.convolve(df_H2, [[.5, .5]])[:, :-1], index=df_H2.index)
以下は速度の比較結果です。
python
1In [11]: # @ppaul さんの方法 2 ...: %timeit c = df_H2.columns; pd.concat([df_H2[[c[i], c[i+1]]].mean(axis=1) for i in range(len(c)-1)], axis=1) 3 ...: # @ppaul さんの方法を修正したもの 4 ...: %timeit pd.DataFrame({i: df_H2.iloc[:, [i, i+1]].mean(axis=1) for i in range(df_H2.shape[1]-1)}) 53.24 ms ± 141 µs per loop (mean ± std. dev. of 7 runs, 100 loops each) 62.13 ms ± 11.3 µs per loop (mean ± std. dev. of 7 runs, 100 loops each) 7 8In [12]: # np.convolve()を用いた方法 9 ...: %timeit df_H2.apply(np.convolve, result_type='expand', v=[.5, .5], mode='valid', axis=1) 10 ...: %timeit df_H2.apply(np.convolve, raw=True, v=[.5, .5], mode='same', axis=1).iloc[:, 1:] 11 ...: %timeit pd.DataFrame(np.convolve(df_H2.to_numpy().ravel(), [.5, .5], 'same').reshape(-1, 5)[:, 1:], index=df_H2.index) 121.13 ms ± 37.6 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each) 13270 µs ± 4.84 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each) 1478.8 µs ± 1.74 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each) 15 16In [13]: # scipy.ndimage.convolve()及びscipy.ndimage.convolve1d()を用いた方法 17 ...: %timeit df_H2.apply(scipy.ndimage.convolve1d, result_type='expand', weights=[.5, .5], axis=1).iloc[:, 1:] 18 ...: %timeit df_H2.apply(scipy.ndimage.convolve1d, raw=True, weights=[.5, .5], axis=1).iloc[:, 1:] 19 ...: %timeit pd.DataFrame(scipy.ndimage.convolve(df_H2, [[.5, .5]])[:, :-1], index=df_H2.index) 201.38 ms ± 15.6 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each) 21366 µs ± 9.11 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each) 22108 µs ± 1.35 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)
投稿2021/06/02 04:54
編集2021/06/02 04:57総合スコア1399
0
ベストアンサー
やりたいことがわかりませんので、二通り書いておきます。
どちらでもないのなら、やりたいことを質問に追加してください。
もし、全部の平均を出したいなら、
python
1df_H2 = pd.DataFrame({'50': [860,950,1040,1140,1220,1390,1450], 2'100': [880,970,1060,1160,1250,1450,1550], 3'150': [890,1000,1080,1220,1330,1550,1650], 4'200': [890,1030,1120,1270,1390,1650,1740], 5'250': [910,1040,1150,1310,1470,1740,1830]}, 6index=['10', '20', '30','40','60','80','100'] ) 7df_H2_mean = df_H2.mean(axis=1).reset_index() 8print(df_H2_mean)
実行結果
python
1>>> print(df_H2_mean) 2 index 0 30 10 886.0 41 20 998.0 52 30 1090.0 63 40 1220.0 74 60 1332.0 85 80 1556.0 96 100 1644.0
2列づつの平均を並べたいなら
python
1df_H2 = pd.DataFrame({'50': [860,950,1040,1140,1220,1390,1450], 2'100': [880,970,1060,1160,1250,1450,1550], 3'150': [890,1000,1080,1220,1330,1550,1650], 4'200': [890,1030,1120,1270,1390,1650,1740], 5'250': [910,1040,1150,1310,1470,1740,1830]}, 6index=['10', '20', '30','40','60','80','100'] ) 7c = df_H2.columns 8df_H2_mean2 = pd.concat([df_H2[[c[i], c[i+1]]].mean(axis=1) for i in range(len(c)-1)], axis=1) 9print(df_H2_mean2)
実行結果
python
1>>> print(df_H2_mean2) 2 0 1 2 3 310 870.0 885.0 890.0 900.0 420 960.0 985.0 1015.0 1035.0 530 1050.0 1070.0 1100.0 1135.0 640 1150.0 1190.0 1245.0 1290.0 760 1235.0 1290.0 1360.0 1430.0 880 1420.0 1500.0 1600.0 1695.0 9100 1500.0 1600.0 1695.0 1785.0
投稿2021/06/01 23:32
総合スコア24670
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2021/06/02 22:00
2021/06/03 22:29
あなたの回答
tips
太字
斜体
打ち消し線
見出し
引用テキストの挿入
コードの挿入
リンクの挿入
リストの挿入
番号リストの挿入
表の挿入
水平線の挿入
プレビュー
質問の解決につながる回答をしましょう。 サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。 また、読む側のことを考えた、分かりやすい文章を心がけましょう。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2021/06/02 06:41