編集履歴

質問編集履歴

誤字修正

2018/12/02 16:43

投稿

musuka

スコア10

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -126,7 +126,7 @@
 # 2018-12-03 04:10:00    39
 #pprint(df_count)
-df = pd.DataFrame({key: list(df_count.index.values), 'num': list(df_count.values)})
+df = pd.DataFrame({'time': list(df_count.index.values), 'num': list(df_count.values)})
 #    time                  num
 #0   2018-12-03 01:00:00   74
 #1   2018-12-03 15:10:00   40

317 121 716 132 256

追記

2018/12/02 16:43

投稿

musuka

スコア10

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -85,4 +85,55 @@
 ⑤直近1カ月のグラフにするとして、weeklyとmonthlyの時系列データは同生成するか。
 仮にtimeを'2018 12-07 02:30'のようなフォーマットにするとして、
 weekly直近の4週間(4件分の辞書)やmonthly(1件分の辞書)は、
-時間の加算をどうやって実装し、生成するのか(datetime,pandasで上手くできないか？)
+時間の加算をどうやって実装し、生成するのか(datetime,pandasで上手くできないか？)
+-============================================
+↓↓↓追記(2018_1203_0123)↓↓↓
+-============================================
+追記①
+⑤の週次、月次グラフのイメージ画像を追加しました。
+(画像では11-21から出てしまってますが)
+現在から直近30日のperiodごとのtimeごとの推移を見たいです。
+追記②
+> {'period': 2  'time': '00:01:2'} # WEEKLY 毎週月曜の01:00に実行
+また、WEEKLYの分がまた厄介で可能なら落としたくないと考えています。
+つまり、最後の:2を落として、
+現在から4回先までのtimeデータを
+4回 lis.append(データ)する？必要があります。
+(12-03 01:00, 12-10 01:00, 12-17 01:00, 12-24 01:00)
+追記③
+groupbyの使い方がいまいちぴんと来てなくて、
+groupbyの関連でvalue_countsを知ったので、一旦実装してみました。
+MySQLでいうところの、
+SELECT period, time, COUNT(*) FROM lis GROUP BY period, time ;
+的な結果を得たいと考えています。
+```python3
+df = pd.DataFrame({'time': [row['time'] for row in lis]})
+# >>> df[:]
+#      time
+# 0    2018-12-31 21:00:00
+# 1    2018-12-07 20:30:00
+# 2    2018-12-02 12:10:00
+#pprint(df, width=273)
+df_count = df['time'].value_counts()
+# 2018-12-02 16:00:00    74
+# 2018-12-03 06:10:00    40
+# 2018-12-03 04:10:00    39
+#pprint(df_count)
+df = pd.DataFrame({key: list(df_count.index.values), 'num': list(df_count.values)})
+#    time                  num
+#0   2018-12-03 01:00:00   74
+#1   2018-12-03 15:10:00   40
+#2   2018-12-03 04:00:00   39
+#pprint(df)
+```
+↓月次のイメージ↓
+![月次のイメージ](a0c47e411852dcba8a73b8f3121fab86.png)

317 121 716 132 256

レイアウト変更

2018/12/02 16:30

投稿

musuka

スコア10

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -27,30 +27,7 @@
 {'period': 3  'time': '00:03:20'} # 毎月20日の03:00に実行
 ]
 ```
-上記のような使いにくい時系列データがあります。
-このデータを加工し、periodごとのtimeごとに件数をカウントし、
-pandasで横軸:time, 縦軸:件数のグラフを書きたいのですが、
-スマートな方法はありますか。
-現在はlis[x]['time']をmm:hhからhh:mmに変更し、
-件数を数えるための辞書を3種類用意し、
-ループして数えてます。
-①hh:mmに変更せずとも、datetimeのstrtimeやら
-　pandasのなんやらで、上手いことできるんじゃなかろうか。
-②mm:hh→hh:mmにする処理(splitで実装)、
-　もっと読みやすくて短い書き方はないのか。
-③件数数える部分の処理(ループでインクリメントして実装)、
-countメソッド？collections.Counter関数？その他？で上手いことできるんじゃなかろうか。
-④直近1カ月のグラフにするとして、weeklyとmonthlyの時系列データは同生成するか。
-仮にtimeを'2018 12-07 02:30'のようなフォーマットにするとして、
-weekly直近の4週間(4件分の辞書)やmonthly(1件分の辞書)は、
-時間の加算をどうやって実装し、生成するのか(datetime,pandasで上手くできないか？)
 ```python3
 lis2 = []
 # mm:hhをhh:mmに変更したlis2を再作成
@@ -81,4 +58,31 @@
 df.plot(kind='area', stacked=True, alpha=0.4)
 plt.show()
 plt.savefig("image.png")
-```
+```
+上記のような使いにくい時系列データがあります。
+このデータを加工し、periodごとのtimeごとに件数をカウントし、
+pandasで横軸:time, 縦軸:件数のグラフを書きたいのですが、
+スマートな方法はありますか。
+現在はlis[x]['time']をmm:hhからhh:mmに変更し、
+件数を数えるための辞書を3種類用意し、
+ループして数えてます。
+①hh:mmに変更せずとも、datetimeのstrtimeやら
+　pandasのなんやらで、上手いことできるんじゃなかろうか。
+②mm:hh→hh:mmにする処理(splitで実装)、
+　もっと読みやすくて短い書き方はないのか。
+③件数数える部分の処理(ループでインクリメントして実装)、
+countメソッド？collections.Counter関数？その他？で上手くできるんじゃないか。
+④件数を数えるなら、辞書かリストのどちらがいいか。
+pandasで使うなら、リストの方がなんとなく使いやすそう。
+⑤直近1カ月のグラフにするとして、weeklyとmonthlyの時系列データは同生成するか。
+仮にtimeを'2018 12-07 02:30'のようなフォーマットにするとして、
+weekly直近の4週間(4件分の辞書)やmonthly(1件分の辞書)は、
+時間の加算をどうやって実装し、生成するのか(datetime,pandasで上手くできないか？)