質問編集履歴

ご質問への回答を追加

2022/09/27 10:14

投稿

kokoro01234

スコア2

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -102,6 +102,11 @@
 if __name__ == "__main__":
     main()
-ソースコード
 ```
+### ご質問への回答
+■tatsu99様
+ご質問ありがとうございます。
+回答ですが、1については「基準のレコードを含めて10件以上」となります。
+2につきましては、ご質問のとおり「基準となるレコードの時刻とユーザのみ」を想定していましたが、私の環境で実行したところ、該当する条件のものがすべて出力されていました。。
+しかし、この部分に関しては全て出力されたとしても、後で簡単に処理できるのでこのままでも良いと思っています。

Python 3.x Python

コードの空白を修正

2022/09/27 08:47

投稿

kokoro01234

スコア2

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -87,8 +87,8 @@
 				aa = datetime.strptime(date,"%Y/%m/%d %H:%M:%S")
 				bb = user
 				cc = atai
-                                csv2 = load_csv(source_file_path)
+				csv2 = load_csv(source_file_path)
-                                for date, user, atai in csv2
+				for date, user, atai in csv2
 				     dd = process_2(aa,bb,cc,csv)
 				     if dd >= 10:
 					yield [date, user]

Python 3.x Python

質問内容の修正

2022/09/27 07:58

投稿

kokoro01234

スコア2

title CHANGED Viewed

	@@ -1,1 +1,1 @@
1	- python csvのループ処理
1	+ python csvのループ処理の高速化

body CHANGED Viewed

@@ -5,9 +5,12 @@
 以下のcsvであれば、2022/05/26 20:52:15から2022/05/26 21:00:22の間に、ユーザーAの値が11回noneとなっているので、Aが新たなcsvに吐き出されるようにしようとしています。
-しかし、自分の書いたスクリプトでは最初の「none」(ヘッダを含め4行目)を検出し、①から③の条件を確認後、次の処理に進んだ際に読み込んでいるcsvの行が意図しない箇所(ヘッダを含め18行目、条件確認後、処理を終了した行の続き)に進んでいました。
+~~しかし、自分の書いたスクリプトでは最初の「none」(ヘッダを含め4行目)を検出し、①から③の条件を確認後、次の処理に進んだ際に読み込んでいるcsvの行が意図しない箇所(ヘッダを含め18行目、条件確認後、処理を終了した行の続き)に進んでいました。
-本来であれば、最初の「none」を検出した後、条件に一致しないので次の行からの処理に進み、2回目のnone(ヘッダを含め8行目)を検出して条件の確認、次は3回目のnoneを検出とやっていきたいのですが、ループ処理が上手くいかず詰まっているところです。
+本来であれば、最初の「none」を検出した後、条件に一致しないので次の行からの処理に進み、2回目のnone(ヘッダを含め8行目)を検出して条件の確認、次は3回目のnoneを検出とやっていきたいのですが、ループ処理が上手くいかず詰まっているところです。~~(自己解決済み)
+しかし、対象のcsvが50万行程あるため自分の書いたスクリプトでは物凄い時間が掛かってしまいます。
+大量の行があるcsvに対してfor文を3回も使用しているのが原因だと思っているのですが、解決方法が分からず困っているため、お知恵を拝借できればと思っております。
+どうぞよろしくお願いいたします。
 ```
@@ -84,8 +87,10 @@
 				aa = datetime.strptime(date,"%Y/%m/%d %H:%M:%S")
 				bb = user
 				cc = atai
+                                csv2 = load_csv(source_file_path)
+                                for date, user, atai in csv2
-				dd = process_2(aa,bb,cc,csv)
+				     dd = process_2(aa,bb,cc,csv)
-				if dd >= 10:
+				     if dd >= 10:
 					yield [date, user]
 			else :
 				pass
@@ -100,11 +105,3 @@
 ソースコード
 ```
-### 試したこと
-該当コードの「process_2」関数に渡しているcsvが「process_1」関数と同じcsvであることが問題なのではと考え、もう一つ同じcsvを格納した変数を作成して、process_2」関数に渡しましたが以下のエラーが発生してしまいました。
-```
-ValueError: time data 'date' does not match format '%Y/%m/%d %H:%M:%S'
-```

Python 3.x Python

不要な変数を削除

2022/09/27 07:01

投稿

kokoro01234

スコア2

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -68,7 +68,6 @@
 	count = 0
 	for date, user, atai in csv:
 		aaa = datetime.strptime(date,"%Y/%m/%d %H:%M:%S")
-		bbb = aaa - day
 		if aaa - day < timedelta(minutes = 10) and user == us and atai ==  at:
 			count += 1

Python 3.x Python