編集履歴

回答編集履歴

完成

2021/07/11 10:34

投稿

スコア388

answer CHANGED Viewed

@@ -1,3 +1,38 @@
+##完成版
+```python
+import pandas as pd
+from openpyxl import Workbook
+import glob
+file_list=glob.glob('//192.168.1.4/pi/mydata202107*')#7月の稼働率ファイルを全て取り込み
+print(file_list)
+l=[] # 一日毎に記録するためのリストを用意
+for file in file_list:　　#7月の稼働率ファイルを一日毎処理
+    df = pd.read_csv(file)  # CSV読み込み、データフレーム化
+    d=(file[23:31])  # 日付の取得
+    df[3]=df[1]==df[2] # 完全停止時間
+    df=df.set_index(0)  #　時間列をインデックスに退避
+    # '日付','稼働時間','無人稼働時間','完全停止時間','カウント' のリストを作成
+    l.append([d] + df.sum().to_list() + [df.sum().sum()])
+df=pd.DataFrame(l) #データをpandasに変更
+df.columns=['日付','稼働時間','無人稼働時間','完全停止時間','カウント']
+df['稼働率']=(df['稼働時間'] / df['カウント'] * 100).round(1)
+filename = d[:6] + '.xlsx'
+df_excel=df.drop(['完全停止時間','カウント'],axis=1)
+df_excel['稼働時間']=df_excel['稼働時間'].astype(str) + '分'
+df_excel['無人稼働時間']=df_excel['無人稼働時間'].astype(str) + '分'
+df_excel['稼働率']=df_excel['稼働率'].astype(str) + '％'
+df_excel.to_excel(filename) # 書き込み
+```
+------
 [concatenating-objects](https://pandas.pydata.org/docs/user_guide/merging.html#concatenating-objects)
 リンク先に参考になる情報があります。

間違いの修正

2021/07/11 10:34

投稿

toshikawa

スコア388

answer CHANGED Viewed

@@ -83,6 +83,7 @@
 いったんファイルを読み込んだあと、このような変更をすると注釈に書いたリストができます。
 forで日付の作成からデータフレーム作成、リスト追記をしていって
-全部処理を終わった後、最初に書いた`pd.DataFrame.concat`で一括処理が可能です。
+全部処理を終わった後、最初に書いた~~pd.DataFrame.concat~~`pd.DataFrame`で一括処理が可能です。
+（各行が入ったリストをデータフレームにするので、こちらでしたね。）
-稼働率は全部一緒になった後のデータフレームでもすぐ出ますので大丈夫です。
+稼働率は全部一緒になった後のデータフレームでも、１行１日になっていますし、すぐ出ます。

CSVデータの処理の仕方を追記

2021/07/11 10:07

投稿

toshikawa

スコア388

answer CHANGED Viewed

@@ -41,4 +41,48 @@
 他の方も書いていますが、**まず、csvの中身を提示してください**
 **日付、稼働時間、無人稼働時間、稼働率**のヘッダーの下にデータがあるのが自然な形だと思いますが、
-データフレームにするまでに色々とやりすぎてデータが変になっています。
+データフレームにするまでに色々とやりすぎてデータが変になっています。
+------
+```python
+data="""21:23 1 0
+21:24 1 0
+21:25 1 0
+21:26 1 0
+21:27 1 0
+21:28 1 0
+21:29 1 0
+21:30 1 0
+21:31 1 0
+21:32 1 0
+21:33 1 0
+21:34 1 0
+21:35 1 0
+21:37 1 0
+21:38 1 0
+21:39 1 0
+21:40 1 0"""
+import io
+import pandas
+l=[]
+d="20210701" # 日付データの抽出に変えてください
+df = pd.read_csv(io.StringIO(data),header=None,sep=' ')　 #　読み込み
+df[3]=df[1]==df[2] # 完全停止時間の列作成
+df=df.set_index(0) # 計算用に時間をindexに退避
+l.append([d] + df.sum().to_list() + [df.sum().sum()]) # count()の分を３つのデータの足し算で代替
+l　 # 日付、稼働時間、無人稼働時間、完全停止時間、カウント
+```
+途中までですがここで投稿しておきます。
+いったんファイルを読み込んだあと、このような変更をすると注釈に書いたリストができます。
+forで日付の作成からデータフレーム作成、リスト追記をしていって
+全部処理を終わった後、最初に書いた`pd.DataFrame.concat`で一括処理が可能です。
+稼働率は全部一緒になった後のデータフレームでもすぐ出ますので大丈夫です。

追加の質問対応

2021/07/11 09:50

投稿

toshikawa

スコア388

answer CHANGED Viewed

@@ -10,4 +10,35 @@
 df=pd.concat(df_list)
 ```
-このようにいったん全てのファイルをデータフレームのリストに格納して、`pandas.DataFrame.concat`で一括処理した後所用の集計を実施してみてはどうでしょうか？
+このようにいったん全てのファイルをデータフレームのリストに格納して、`pandas.DataFrame.concat`で一括処理した後所用の集計を実施してみてはどうでしょうか？
+------
+```python
+data="""index data
+0 日付20210701
+1 稼働時間96分
+2 無人稼働時間0分
+3 稼働率100.0%
+4 日付20210702
+5 稼働時間299分
+6 無人稼働時間0分
+7 稼働率99.7%
+8 日付20210703
+9 稼働時間777分
+10 無人稼働時間1分
+11 稼働率99.7%"""
+import io
+import pandas as pd
+df = pd.read_csv(io.StringIO(data),sep=' ')
+df['index']=df['index']//4
+df.index=df.index % 4
+df.pivot(columns='index',values='data').T
+```
+いちおうやってみましたが、**お勧めしません**
+他の方も書いていますが、**まず、csvの中身を提示してください**
+**日付、稼働時間、無人稼働時間、稼働率**のヘッダーの下にデータがあるのが自然な形だと思いますが、
+データフレームにするまでに色々とやりすぎてデータが変になっています。