質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.46%
Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

Q&A

解決済

1回答

482閲覧

日付型のindexを持つDataFrameの列に、別のDataFrameのユニークな値の列を追加し相関関係を計算

augie_kz

総合スコア2

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

0グッド

0クリップ

投稿2021/11/29 02:05

編集2021/11/29 02:25

日付をindexとするDataFrameで
フルーツの
当日の販売量(Volume)
翌日の販売量(Volume_Next)
を管理する以下のような形のDataFrameがあったとします。

当日の販売量(fruits_volume)

DateFruitsVolume
2019-11-27Apple2
2019-11-28Apple5
2019-11-27Orange1
2019-11-28Orange1
2019-11-27Tomato3
2019-11-28Tomato2

翌日の販売量(fruits_volume_next)

DateFruitsVolume_Next
2019-11-27Apple5
2019-11-28Apple6
2019-11-27Orange1
2019-11-28Orange2
2019-11-27Tomato2
2019-11-28Tomato4

りんごの当日の販売量
他の果物の翌日の販売量
の相関関係をPandasのcorr関数で解析するため、以下のようなDataFrameを作成したいのですが、どのように生成すればよいか悩んでおります。
Volumeよりあとの各列には、果物ごとに翌日の販売量が格納された列を挿入したいです。
また、可能な限りfor文は使わず実現したいと思っています。

DateVolumeAppleOrangeTomato
2019-11-272512
2019-11-285624

Python

1 2# fruits_volume_nextのFruits列の値がユニークなリストを生成 3fruits_unique = fruits_volume_next['Fruits'].unique() 4 5# corr計算用のマトリクス生成用にfruits_volumeのりんごデータをコピー 6apple_other_next_matrix = fruits_volume[fruits_volume['Fruits'] == 'Apple'] 7 8# (不明点)corr計算用のマトリクスに果物ごとの列を作成し、翌日の販売量を格納 9# apple_other_next_matrix[fruits_unique] = ???? 10 11# りんごの販売量と翌日の他の果物の相関関係を算出 12apple_other_next_corr = apple_other_next_matrix.corr(method='pearson')['Volume'] 13# 当日のりんごの販売量同士の1の相関 及び 当日のりんごと翌日のりんごの販売量同士の相関を除外 14apple_other_next_corr = apple_other_next_corr[((apple_other_next_corr.index != 'Volume') | (apple_other_next_corr.index != 'Apple'))] 15
  • fruits_uniqueのリストの値を列としてapple_other_next_matrixに一挙に追加
  • 追加した列にfruits_volume_nextのapple_other_next_matrixとindexが合致するVolume_Nextの値を追加

したいのですがやり方がわからず。。ご助言いただければ幸いです。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

pivot_table を使ってみました。

python

1result = ( 2 fruits_volume 3 .pivot_table(index='Date', columns='Fruits', values='Volume')['Apple'] 4 .to_frame('Volume') 5 .join(fruits_volume_next 6 .pivot_table(index='Date', columns='Fruits', values='Volume_Next'), 7 on='Date') 8 .reset_index()) 9 10print(result) 11 12# 13 Date Volume Apple Orange Tomato 140 2019-11-27 2 5 1 2 151 2019-11-28 5 6 2 4

投稿2021/11/29 04:41

melian

総合スコア19865

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

augie_kz

2021/12/03 06:03

やりたいことが実現できました!! ありがとうございます。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.46%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問