質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

809閲覧

【Python】一定の時間間隔ごとに部屋に入室している人数を出力したい。

Acker

総合スコア1

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

1クリップ

投稿2022/04/25 09:52

編集2022/04/25 16:10

前提

ある部屋の入退室時間を記録した以下の様な CSV があります。

・入退室記録(in-out.csv)

社員ID入室時間退室時間
A102021/7/1 7:012021/7/1 20:40
A112021/7/1 7:052021/7/1 17:30
A122021/7/1 7:102021/7/1 7:28

(... 以下、3000 行ほど続く)

また、出力したい時間範囲をあらわす CSV があります。

・計測時間範囲.csv(count-time.csv)

計測開始日時計測終了日時
2021/7/1 7:002021/7/1 7:10
2021/7/1 7:102021/7/1 7:20
2021/7/1 7:202021/7/1 7:30
2021/7/1 7:402021/7/1 7:50

...(以下、10分間隔で 24 時まで続く)

やりたいこと

入退室時間を記録した csv に対し、時間範囲の CSV の範囲ごとに「どの時間帯に何人が入室していたか」というリストを Python で出力したいです。
↓ 出力csvイメージ

計測開始日時計測終了日時同時入室人数
2021/7/1 7:002021/7/1 7:102
2021/7/1 7:102021/7/1 7:203
2021/7/1 7:202021/7/1 7:303
2021/7/1 7:302021/7/1 7:402

特定の時間範囲のみであれば

入室時間 <= 計測終了日時 And 計測開始日時 < 退室時間

で出力できるところまでは理解し、特定の時間帯(この場合は 9:00 -- 9:10 の間)を指定してカウントするコードは以下の様に書いています。(こちらも間違いがあれば、あるいはスマートな書き方があればご指摘いただきたいです)

手動で指定している 9:00 -- 9:10 をcount-time.csv から読み込んで「出力csvイメージ.csv」にような形でカウント数を出したいのですが、ここからどのようにしたらよいか詰まってしまいました。

python

1import pandas as pd 2import datetime as dt 3 4# csv 読み込み 5inout = pd.read_csv("in-out.csv") 6ct = pd.read_csv("count-time.csv") 7 8# 各カラムをdatetime型へ変換 9inout['in'] = pd.to_datetime(inout['in']) 10inout['out'] = pd.to_datetime(inout['out']) 11ct['start'] = pd.to_datetime(ct['start']) 12ct['end'] = pd.to_datetime(ct['end']) 13 14# 2021/7/1 9:00 -- 9:10 の間に室内にいた人数をカウント 15# (入室時間 <= 計測終了日時) And (計測開始日時 < 退室時間) 16len(inout[(inout["in"] <= dt.datetime(2021,7,1,9,10)) & (dt.datetime(2021,7,1,9,0) <= inout["out"])])

何卒よろしくお願いいたします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

ct.iterrows()で一行ずつ取り出し、row['end'],row['start']で時間を取り出しています。
その後lenで数えてリストに格納し、countという名前でctのデータフレームに列を追加しcsvを出力しています。

python

1import pandas as pd 2import datetime as dt 3 4# csv 読み込み 5inout = pd.read_csv("in-out.csv") 6ct = pd.read_csv("count-time.csv") 7 8# 各カラムをdatetime型へ変換 9inout['in'] = pd.to_datetime(inout['in']) 10inout['out'] = pd.to_datetime(inout['out']) 11ct['start'] = pd.to_datetime(ct['start']) 12ct['end'] = pd.to_datetime(ct['end']) 13 14# 2021/7/1 9:00 -- 9:10 の間に室内にいた人数をカウント 15# (入室時間 <= 計測終了日時) And (計測開始日時 < 退室時間) 16# print(len(inout[(inout["in"] <= dt.datetime(2021, 7, 1, 9, 10)) 17# & (dt.datetime(2021, 7, 1, 9, 0) <= inout["out"])])) 18tmp = [] 19for index, row in ct.iterrows(): # 1行ずつ取り出す 20 # 行データからstart stopの列の値を取り出し比較。条件に合うものを数えてリストに追加 21 tmp.append(len(inout[(inout["in"] <= row['end']) 22 & (row['start'] < inout["out"])])) 23ct['count'] = tmp # リストを列として追加 24ct.to_csv("output.csv", index=False) # csvを出力(indexはないので無効に)

余談ですが、文字列の式、実際のプログラム、出力csvイメージとでそれぞれ式が微妙に違っています。
文字列の式に直すと、
文字列の式:入室時間 <= 計測終了日時 And 計測開始日時 < 退室時間
プログラム:入室時間 <= 計測終了日時 And 計測開始日時 "<=" 退室時間
出力イメージ:入室時間 "<" 計測終了日時 And 計測開始日時 <= 退室時間 (退室時間の不等号は不明)
要は同じ時間を含めるかどうかの部分でずれています。

投稿2022/04/27 04:17

irognodyci

総合スコア227

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

Acker

2022/04/27 05:32

ありがとうございます! 想定通りのことができました!! 式の違いについても理解しました。退室時間の扱いについては「<=」が正しいので、プログラム側のとおりです。 ご指摘ありがとうございます。 おかげさまで理解も進みましたので、こちらを応用していろいろチャレンジしてみようと思います。 ありがとうございました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問