配列の要素のカウント

Stanford Drone Dataset 等のファイルの配列から要素をカウントしたいです．

files
10 826 1895 853 1943 9000 1 0 0 "Pedestrian"
20 826 1895 853 1943 9001 1 0 1 "Pedestrian"
30 826 1895 853 1943 9002 1 0 1 "Pedestrian"
40 826 1895 853 1943 9003 1 0 1 "Pedestrian"
50 826 1895 853 1943 9004 1 0 1 "Pedestrian"
60 826 1895 853 1943 9005 1 0 1 "Pedestrian"
70 826 1895 853 1943 9006 1 0 1 "Pedestrian"
80 826 1895 853 1943 9007 1 0 1 "Pedestrian"
9・
10・
11・
122 968 263 1009 344 8398 0 0 1 "Pedestrian"
132 968 263 1009 344 8399 0 0 1 "Pedestrian"
142 968 263 1009 344 8400 0 0 1 "Pedestrian"
152 968 263 1009 344 8401 0 0 1 "Pedestrian"
162 968 263 1009 344 8402 0 0 1 "Pedestrian"
17・
18・
19・
203 353 1140 398 1193 9516 0 0 1 "Biker"
213 355 1140 400 1193 9517 0 0 1 "Biker"
223 357 1140 402 1193 9518 0 0 1 "Biker"
233 359 1140 405 1193 9519 0 0 1 "Biker"
243 362 1140 407 1193 9520 0 0 1 "Biker"
253 364 1140 409 1193 9521 0 0 1 "Biker"
263 366 1140 412 1193 9522 0 0 1 "Biker"
27・
28・
29・
304 1066 1254 1100 1327 7960 0 1 1 "Pedestrian"
314 1066 1254 1100 1327 7961 0 1 1 "Pedestrian"
324 1068 1254 1102 1327 7962 0 1 1 "Pedestrian"
334 1068 1254 1102 1327 7963 0 1 1 "Pedestrian"
344 1068 1249 1102 1323 7964 0 1 1 "Pedestrian"
35・
36・
37・

ファイルは上記の形となっており，str型で空白スペースで分けられています．つまり，一行目であれば要素は43個ということです．
ここで，"Pedestrian"となっている要素の個数を調べたいです．
望みとしては，一行目でいうとstr型で要素数が43個のところを空白スペースで分けられた要素(10個)にしたいです．
わかる方がいらっしゃいましたら，教えていただきたいです．
よろしくお願いします．

行動規範の内容に同意します

回答2件

ベストアンサー

pandas.read_csvで、オプション引数delim_whitespace=Trueを指定して読み込むと、1個以上の空白を区切り文字とするデータを読み込めます。ヘッダーがないので、header=Noneも指定します。

すると、"Pedestrian"や"Biker"が書かれている列は、(0オリジンなので)9でアクセスできます。(df[9] == "Pedestrian")で得られる真偽値のSeriesにsumを適用すると、"Pedestrian"の個数が得られます。

Python
1import pandas as pd
2import io
3
4txt = """
50 826 1895 853 1943 9000 1 0 0 "Pedestrian"
60 826 1895 853 1943 9001 1 0 1 "Pedestrian"
70 826 1895 853 1943 9002 1 0 1 "Pedestrian"
80 826 1895 853 1943 9003 1 0 1 "Pedestrian"
90 826 1895 853 1943 9004 1 0 1 "Pedestrian"
100 826 1895 853 1943 9005 1 0 1 "Pedestrian"
110 826 1895 853 1943 9006 1 0 1 "Pedestrian"
120 826 1895 853 1943 9007 1 0 1 "Pedestrian"
132 968 263 1009 344 8398 0 0 1 "Pedestrian"
142 968 263 1009 344 8399 0 0 1 "Pedestrian"
152 968 263 1009 344 8400 0 0 1 "Pedestrian"
162 968 263 1009 344 8401 0 0 1 "Pedestrian"
172 968 263 1009 344 8402 0 0 1 "Pedestrian"
183 353 1140 398 1193 9516 0 0 1 "Biker"
193 355 1140 400 1193 9517 0 0 1 "Biker"
203 357 1140 402 1193 9518 0 0 1 "Biker"
213 359 1140 405 1193 9519 0 0 1 "Biker"
223 362 1140 407 1193 9520 0 0 1 "Biker"
233 364 1140 409 1193 9521 0 0 1 "Biker"
243 366 1140 412 1193 9522 0 0 1 "Biker"
254 1066 1254 1100 1327 7960 0 1 1 "Pedestrian"
264 1066 1254 1100 1327 7961 0 1 1 "Pedestrian"
274 1068 1254 1102 1327 7962 0 1 1 "Pedestrian"
284 1068 1254 1102 1327 7963 0 1 1 "Pedestrian"
294 1068 1249 1102 1323 7964 0 1 1 "Pedestrian"
30"""
31
32df = pd.read_csv(io.StringIO(txt), header=None, delim_whitespace=True)
33print((df[9] == "Pedestrian").sum())