前提・実現したいこと
以下で作成したようなデータフレームから
それぞれのPlayer別に10行ずつランダムに抽出した新しいデータフレームを作成し、
その後、そのデータフレームからagg集計して標準偏差等を求めていきたいです。
分析のイメージは、各Playerごとにサンプル数を等しくし、各値においてその誤差を評価していく、といった感じになります。
ご教授の程、よろしくお願い致します。
該当のソースコード
python
1import pandas as pd 2import numpy as np 3pd.options.display.float_format="{:.1f}".format 4#Create a random data frame 5start,end = "2021/4/1","2021/4/30" 6dates = pd.date_range(start=start,end=end,freq="D") 7players = [f"Player{i}"for i in range(1,31)] 8N = 200 9dates = np.random.choice(dates,size=N) 10dates.sort() 11players=np.random.choice(players,size=N) 12df = pd.DataFrame({ 13 "Date": dates, 14 "Player": players, 15 "Speed": np.random.sample(N) * 100.0, 16 "Angle": np.random.sample(N) * 40.0 - 20.0, 17}) 18#grouping 19dfx = df.groupby("Player").agg({ 20 "Player":"count", 21 "Speed":[np.mean,np.std], 22 "Angle":[np.mean,np.std], 23})
補足情報(FW/ツールのバージョンなど)
windows11,python3.9.4,vscode
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2021/12/13 02:59