Pythonのtslearnを用いて時系列データ(あるチェーンの店舗ごとの売り上げ)のクラスタリングをしたく考えております。しかし、元のデータフレームが以下の様に、各店舗が全て
同じカラムに入ってしまっております。
Date Shop Sales
2017-11-01 A 1
2017-11-07 B 1
2017-11-18 A 1
2017-11-27 C 1
2017-12-05 A 1
2017-12-12 B 1
2017-12-22 A 1
2017-12-29 C 1
これをどうにかして、以下の様に、店舗ごとの累積の売り上げに直せれば、
クラスタリングができるかと考えているのですが、どのようにすれば良いか
分かりません。
Date A B C
2017-11-01 1 0 0
2017-11-07 1 1 0
2017-11-18 2 1 0
2017-11-27 2 1 1
2017-12-05 3 1 1
2017-12-12 3 2 1
2017-12-22 4 2 1
2017-12-29 4 2 2
何か方法がございましたら、ご教示下さい。なお実際のデータはかなりの大規模な
データとなっており、店舗も数百のオーダーのため、手での集計が困難な状況です。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。