質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

Q&A

解決済

2回答

580閲覧

python 2つの列にある値の平均を別のDFに元DF列全ての平均を計算して順次貼付

jimmyjimmy

総合スコア1

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

0グッド

0クリップ

投稿2021/06/01 22:08

2つの列にある値の平均を別のデーターフレームに元データーフレーム列分 
平均を順次して貼付る方法を教えてください。

2つの列にある値の平均を別のデーターフレームに列の追加をすることは出来たのですが、
それを順次元とデーターフレームにある列分すべてを左から右に順番に平均を出して
別のデーターフレームに追加していく方法が分かりません。

y=1、y=0+yとか無理やりやって1行だけ追加することが出来たのですが
そこから前に進めません。

宜しくお願い致します。

df_H2 = pd.DataFrame({'50': [860,950,1040,1140,1220,1390,1450],
'100': [880,970,1060,1160,1250,1450,1550],
'150': [890,1000,1080,1220,1330,1550,1650],
'200': [890,1030,1120,1270,1390,1650,1740],
'250': [910,1040,1150,1310,1470,1740,1830]},
index=['10', '20', '30','40','60','80','100'] )
df_H2 = df_H2.reset_index()
df_index = df_H2.iloc[:,[0]]
aves = []
for x,data in df_H2.iterrows():
x +=0
if x ==7:
break

ave = (df_H2.iloc[x,y]+df_H2.iloc[x,y+1])/2 aves.append(ave) y=1 y =0+y

df_index[y]=aves
_df = df_index
_df

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

解決済になっていますが、参考として別解を書いておきます。


numpyの関数np.convolve()、あるいはscipyの関数scipy.ndimage.convolve()を使うと簡単かつ高速に計算できます。
この関数は、配列[a, b, c, d]と重み配列[q, p]を渡すと、[ap+bq, bp+cq, cp+dq]という配列を返します。このとき重み配列[q, p][0.5, 0.5]を代入すれば、配列の隣り合った数の平均が求まります。

python

1In [1]: import numpy as np 2 ...: import pandas as pd 3 ...: import scipy.ndimage 4 5In [2]: df_H2 = pd.DataFrame({'50': [860, 950, 1040, 1140, 1220, 1390, 1450], 6 ...: '100': [880, 970, 1060, 1160, 1250, 1450, 1550], 7 ...: '150': [890, 1000, 1080, 1220, 1330, 1550, 1650], 8 ...: '200': [890, 1030, 1120, 1270, 1390, 1650, 1740], 9 ...: '250': [910, 1040, 1150, 1310, 1470, 1740, 1830]}, 10 ...: index=['10', '20', '30', '40', '60', '80', '100']) 11 ...: df_H2 12Out[2]: 13 50 100 150 200 250 1410 860 880 890 890 910 1520 950 970 1000 1030 1040 1630 1040 1060 1080 1120 1150 1740 1140 1160 1220 1270 1310 1860 1220 1250 1330 1390 1470 1980 1390 1450 1550 1650 1740 20100 1450 1550 1650 1740 1830 21 22In [3]: df_H2.apply(np.convolve, result_type='expand', v=[.5, .5], mode='valid', axis=1) 23Out[3]: 24 0 1 2 3 2510 870.0 885.0 890.0 900.0 2620 960.0 985.0 1015.0 1035.0 2730 1050.0 1070.0 1100.0 1135.0 2840 1150.0 1190.0 1245.0 1290.0 2960 1235.0 1290.0 1360.0 1430.0 3080 1420.0 1500.0 1600.0 1695.0 31100 1500.0 1600.0 1695.0 1785.0 32 33In [4]: pd.DataFrame(scipy.ndimage.convolve(df_H2, [[.5, .5]])[:, :-1], index=df_H2.index) 34Out[4]: 35 0 1 2 3 3610 870 885 890 900 3720 960 985 1015 1035 3830 1050 1070 1100 1135 3940 1150 1190 1245 1290 4060 1235 1290 1360 1430 4180 1420 1500 1600 1695 42100 1500 1600 1695 1785

応用していろいろなやり方がありますので以下に列挙します。

python

1df_H2.apply(np.convolve, result_type='expand', v=[.5, .5], mode='valid', axis=1) 2df_H2.apply(np.convolve, raw=True, v=[.5, .5], mode='same', axis=1).iloc[:, 1:] 3pd.DataFrame(np.convolve(df_H2.to_numpy().ravel(), [.5, .5], 'same').reshape(-1, 5)[:, 1:], index=df_H2.index) 4pd.DataFrame(scipy.ndimage.convolve(df_H2, [[.5, .5]])[:, :-1], index=df_H2.index) 5df_H2.apply(scipy.ndimage.convolve, result_type='expand', weights=[.5, .5], axis=1).iloc[:, 1:] 6df_H2.apply(scipy.ndimage.convolve, raw=True, weights=[.5, .5], axis=1).iloc[:, 1:] 7pd.DataFrame(scipy.ndimage.convolve(df_H2, [[.5, .5]])[:, :-1], index=df_H2.index)

以下は速度の比較結果です。

python

1In [11]: # @ppaul さんの方法 2 ...: %timeit c = df_H2.columns; pd.concat([df_H2[[c[i], c[i+1]]].mean(axis=1) for i in range(len(c)-1)], axis=1) 3 ...: # @ppaul さんの方法を修正したもの 4 ...: %timeit pd.DataFrame({i: df_H2.iloc[:, [i, i+1]].mean(axis=1) for i in range(df_H2.shape[1]-1)}) 53.24 ms ± 141 µs per loop (mean ± std. dev. of 7 runs, 100 loops each) 62.13 ms ± 11.3 µs per loop (mean ± std. dev. of 7 runs, 100 loops each) 7 8In [12]: # np.convolve()を用いた方法 9 ...: %timeit df_H2.apply(np.convolve, result_type='expand', v=[.5, .5], mode='valid', axis=1) 10 ...: %timeit df_H2.apply(np.convolve, raw=True, v=[.5, .5], mode='same', axis=1).iloc[:, 1:] 11 ...: %timeit pd.DataFrame(np.convolve(df_H2.to_numpy().ravel(), [.5, .5], 'same').reshape(-1, 5)[:, 1:], index=df_H2.index) 121.13 ms ± 37.6 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each) 13270 µs ± 4.84 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each) 1478.8 µs ± 1.74 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each) 15 16In [13]: # scipy.ndimage.convolve()及びscipy.ndimage.convolve1d()を用いた方法 17 ...: %timeit df_H2.apply(scipy.ndimage.convolve1d, result_type='expand', weights=[.5, .5], axis=1).iloc[:, 1:] 18 ...: %timeit df_H2.apply(scipy.ndimage.convolve1d, raw=True, weights=[.5, .5], axis=1).iloc[:, 1:] 19 ...: %timeit pd.DataFrame(scipy.ndimage.convolve(df_H2, [[.5, .5]])[:, :-1], index=df_H2.index) 201.38 ms ± 15.6 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each) 21366 µs ± 9.11 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each) 22108 µs ± 1.35 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)

投稿2021/06/02 04:54

編集2021/06/02 04:57
kirara0048

総合スコア1399

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

jimmyjimmy

2021/06/02 06:41

ありがとうございます、凄すぎてまだ咀嚼できないのですがやってみます。
guest

0

ベストアンサー

やりたいことがわかりませんので、二通り書いておきます。
どちらでもないのなら、やりたいことを質問に追加してください。

もし、全部の平均を出したいなら、

python

1df_H2 = pd.DataFrame({'50': [860,950,1040,1140,1220,1390,1450], 2'100': [880,970,1060,1160,1250,1450,1550], 3'150': [890,1000,1080,1220,1330,1550,1650], 4'200': [890,1030,1120,1270,1390,1650,1740], 5'250': [910,1040,1150,1310,1470,1740,1830]}, 6index=['10', '20', '30','40','60','80','100'] ) 7df_H2_mean = df_H2.mean(axis=1).reset_index() 8print(df_H2_mean)

実行結果

python

1>>> print(df_H2_mean) 2 index 0 30 10 886.0 41 20 998.0 52 30 1090.0 63 40 1220.0 74 60 1332.0 85 80 1556.0 96 100 1644.0

2列づつの平均を並べたいなら

python

1df_H2 = pd.DataFrame({'50': [860,950,1040,1140,1220,1390,1450], 2'100': [880,970,1060,1160,1250,1450,1550], 3'150': [890,1000,1080,1220,1330,1550,1650], 4'200': [890,1030,1120,1270,1390,1650,1740], 5'250': [910,1040,1150,1310,1470,1740,1830]}, 6index=['10', '20', '30','40','60','80','100'] ) 7c = df_H2.columns 8df_H2_mean2 = pd.concat([df_H2[[c[i], c[i+1]]].mean(axis=1) for i in range(len(c)-1)], axis=1) 9print(df_H2_mean2)

実行結果

python

1>>> print(df_H2_mean2) 2 0 1 2 3 310 870.0 885.0 890.0 900.0 420 960.0 985.0 1015.0 1035.0 530 1050.0 1070.0 1100.0 1135.0 640 1150.0 1190.0 1245.0 1290.0 760 1235.0 1290.0 1360.0 1430.0 880 1420.0 1500.0 1600.0 1695.0 9100 1500.0 1600.0 1695.0 1785.0

投稿2021/06/01 23:32

ppaul

総合スコア24670

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

jimmyjimmy

2021/06/01 23:43

ありがとうございます、2番目の方です。何日も悩んでなかなかできず投稿しました。
jimmyjimmy

2021/06/02 22:00

df_H2_mean2 = pd.concat([df_H2[[c[i], c[i+1]]].mean(axis=1) for i in range(len(c)-1)], axis=1) 初歩的なことで申し訳ありません、[]の使い方がわかりません。 pd.concat([df_H2[[c[i], c[i+1]]].mean(axis=1) for i in range(len(c)-1)], axis=1) 一番外側が内包表記でfor文を使っている df_H2[[c[i], c[i+1]]].mean(axis=1) for i in range(len(c)-1) concatで結合のリスト [c[i], c[i+1]] meanで平均 でしょうか?
jimmyjimmy

2021/06/03 22:29

解決できました、ありがとうございました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問