日付をindexとするDataFrameで
フルーツの
当日の販売量(Volume)
翌日の販売量(Volume_Next)
を管理する以下のような形のDataFrameがあったとします。
当日の販売量(fruits_volume)
Date | Fruits | Volume |
---|---|---|
2019-11-27 | Apple | 2 |
2019-11-28 | Apple | 5 |
2019-11-27 | Orange | 1 |
2019-11-28 | Orange | 1 |
2019-11-27 | Tomato | 3 |
2019-11-28 | Tomato | 2 |
翌日の販売量(fruits_volume_next)
Date | Fruits | Volume_Next |
---|---|---|
2019-11-27 | Apple | 5 |
2019-11-28 | Apple | 6 |
2019-11-27 | Orange | 1 |
2019-11-28 | Orange | 2 |
2019-11-27 | Tomato | 2 |
2019-11-28 | Tomato | 4 |
りんごの当日の販売量
他の果物の翌日の販売量
の相関関係をPandasのcorr関数で解析するため、以下のようなDataFrameを作成したいのですが、どのように生成すればよいか悩んでおります。
Volumeよりあとの各列には、果物ごとに翌日の販売量が格納された列を挿入したいです。
また、可能な限りfor文は使わず実現したいと思っています。
Date | Volume | Apple | Orange | Tomato |
---|---|---|---|---|
2019-11-27 | 2 | 5 | 1 | 2 |
2019-11-28 | 5 | 6 | 2 | 4 |
Python
1 2# fruits_volume_nextのFruits列の値がユニークなリストを生成 3fruits_unique = fruits_volume_next['Fruits'].unique() 4 5# corr計算用のマトリクス生成用にfruits_volumeのりんごデータをコピー 6apple_other_next_matrix = fruits_volume[fruits_volume['Fruits'] == 'Apple'] 7 8# (不明点)corr計算用のマトリクスに果物ごとの列を作成し、翌日の販売量を格納 9# apple_other_next_matrix[fruits_unique] = ???? 10 11# りんごの販売量と翌日の他の果物の相関関係を算出 12apple_other_next_corr = apple_other_next_matrix.corr(method='pearson')['Volume'] 13# 当日のりんごの販売量同士の1の相関 及び 当日のりんごと翌日のりんごの販売量同士の相関を除外 14apple_other_next_corr = apple_other_next_corr[((apple_other_next_corr.index != 'Volume') | (apple_other_next_corr.index != 'Apple'))] 15
- fruits_uniqueのリストの値を列としてapple_other_next_matrixに一挙に追加
- 追加した列にfruits_volume_nextのapple_other_next_matrixとindexが合致するVolume_Nextの値を追加
したいのですがやり方がわからず。。ご助言いただければ幸いです。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2021/12/03 06:03