python
1import csv 2import pandas as pd 3import re 4list1 = ['disneysea-wait-time-2017-6-1-lv.html.csv','disneysea-wait-time-2017-6-2-ty.html.csv',] 5df_list = [] 6for date in list1: 7 print (date) 8 html = pd.read_csv(date) 9 df_list.append(html) 10 df_list[0] 11 print (html) 12 print (html.dtypes) 13 regexp = re.compile("<rayt.*/rayt>") 14 atags = regexp.findall(html) 15for atag in atags: 16 html = html.replace(atag, "") 17 print(html) 18 # df = data[0].apply(lambda x: pd.Series(x.split('\t')))
コードはこうなっているのですが、どうしても毎回エラーが出ます。
"
"
"<rayt>
<vmuso class=""time"">11:15</vmuso>
<uozlv class=""na"">-</uozlv>
<uozlv class=""w20"">5</uozlv>
<gvqbd class=""na"">-</gvqbd>
<gvqbd class=""w40"">30</gvqbd>
<vmuso class=""na"">-</vmuso>
<vmuso class=""w20"">15</vmuso>
<vmuso class=""na"">-</vmuso>
<uozlv class=""w20"">15</uozlv>
<gvqbd class=""w20"">10</gvqbd>
<uozlv class=""na"">-</uozlv>
</rayt>"
"
"
"<rayt>
<gvqbd class=""time"">11:45</gvqbd>
<gvqbd class=""w20"">5</gvqbd>
<vmuso class=""w20"">15</vmuso>
<gvqbd class=""na"">-</gvqbd>
<vmuso class=""w40"">25</vmuso>
<vmuso class=""na"">-</vmuso>
<vmuso class=""w20"">15</vmuso>
<gvqbd class=""w20"">5</gvqbd>
<uozlv class=""w20"">15</uozlv>
<uozlv class=""w20"">5</uozlv>
<gvqbd class=""w20"">5</gvqbd>
</rayt>"
"
"
"<rayt>
<gvqbd class=""time"">12:15</gvqbd>
<vmuso class=""w20"">5</vmuso>
<uozlv class=""w20"">15</uozlv>
<gvqbd class=""na"">-</gvqbd>
<vmuso class=""w40"">30</vmuso>
<gvqbd class=""w20"">5</gvqbd>
<uozlv class=""w20"">10</uozlv>
<uozlv class=""w20"">5</uozlv>
<uozlv class=""w20"">15</uozlv>
<gvqbd class=""w20"">10</gvqbd>
<vmuso class=""w20"">5</vmuso>
</rayt>"
"
"
"<rayt>
<gvqbd class=""time"">12:45</gvqbd>
<vmuso class=""w20"">5</vmuso>
<uozlv class=""w20"">5</uozlv>
<vmuso class=""na"">-</vmuso>
<vmuso class=""w40"">25</vmuso>
<gvqbd class=""w20"">5</gvqbd>
<vmuso class=""w20"">5</vmuso>
<vmuso class=""w20"">5</vmuso>
<gvqbd class=""w20"">15</gvqbd>
<vmuso class=""w20"">5</vmuso>
<uozlv class=""w20"">5</uozlv>
</rayt>"
"
"
"<rayt>
<vmuso class=""time"">13:15</vmuso>
<gvqbd class=""na"">-</gvqbd>
<gvqbd class=""na"">-</gvqbd>
<uozlv class=""na"">-</uozlv>
<vmuso class=""w40"">30</vmuso>
<vmuso class=""na"">-</vmuso>
<vmuso class=""w20"">10</vmuso>
<gvqbd class=""w20"">20</gvqbd>
<uozlv class=""w20"">10</uozlv>
<gvqbd class=""w20"">10</gvqbd>
<gvqbd class=""w20"">20</gvqbd>
</rayt>"
"
"
"<rayt>
<gvqbd class=""time"">13:45</gvqbd>
<gvqbd class=""na"">-</gvqbd>
<uozlv class=""na"">-</uozlv>
<vmuso class=""na"">-</vmuso>
<gvqbd class=""w40"">30</gvqbd>
<gvqbd class=""na"">-</gvqbd>
<vmuso class=""w20"">5</vmuso>
<gvqbd class=""w20"">20</gvqbd>
<vmuso class=""w20"">10</vmuso>
<vmuso class=""w20"">10</vmuso>
<gvqbd class=""w20"">20</gvqbd>
</rayt>"
"
"
"<rayt>
<vmuso class=""time"">14:15</vmuso>
<gvqbd class=""na"">-</gvqbd>
<uozlv class=""na"">-</uozlv>
<uozlv class=""na"">-</uozlv>
<vmuso class=""w40"">25</vmuso>
<gvqbd class=""w20"">5</gvqbd>
<uozlv class=""w20"">5</uozlv>
<vmuso class=""w20"">20</vmuso>
<gvqbd class=""w20"">5</gvqbd>
<vmuso class=""w20"">5</vmuso>
<vmuso class=""w20"">20</vmuso>
</rayt>"
"
"
"<rayt>
<gvqbd class=""time"">14:45</gvqbd>
<uozlv class=""na"">-</uozlv>
<gvqbd class=""na"">-</gvqbd>
<gvqbd class=""na"">-</gvqbd>
<gvqbd class=""w40"">25</gvqbd>
<gvqbd class=""w20"">5</gvqbd>
<uozlv class=""w20"">10</uozlv>
<vmuso class=""w20"">20</vmuso>
<gvqbd class=""w20"">10</gvqbd>
<vmuso class=""w20"">5</vmuso>
<vmuso class=""w20"">20</vmuso>
</rayt>"
"
"
"<rayt>
<gvqbd class=""time"">15:15</gvqbd>
<uozlv class=""na"">-</uozlv>
<gvqbd class=""w20"">15</gvqbd>
<vmuso class=""na"">-</vmuso>
<vmuso class=""w40"">25</vmuso>
<gvqbd class=""w20"">5</gvqbd>
<vmuso class=""w20"">10</vmuso>
<gvqbd class=""w20"">20</gvqbd>
<uozlv class=""w20"">10</uozlv>
<uozlv class=""w20"">5</uozlv>
<gvqbd class=""w20"">20</gvqbd>
</rayt>"
"
"
"<rayt>
<gvqbd class=""time"">15:45</gvqbd>
<vmuso class=""na"">-</vmuso>
<vmuso class=""na"">-</vmuso>
<uozlv class=""na"">-</uozlv>
<gvqbd class=""w40"">25</gvqbd>
<gvqbd class=""na"">-</gvqbd>
<vmuso class=""w20"">10</vmuso>
<uozlv class=""w20"">20</uozlv>
<gvqbd class=""w20"">15</gvqbd>
<gvqbd class=""w20"">10</gvqbd>
<gvqbd class=""w20"">20</gvqbd>
</rayt>"
"
"
"<rayt>
<uozlv class=""time"">16:15</uozlv>
<vmuso class=""na"">-</vmuso>
<vmuso class=""na"">-</vmuso>
<uozlv class=""na"">-</uozlv>
<gvqbd class=""w40"">30</gvqbd>
<vmuso class=""w20"">5</vmuso>
<vmuso class=""w20"">10</vmuso>
<uozlv class=""w20"">20</uozlv>
<uozlv class=""w20"">5</uozlv>
<uozlv class=""w20"">10</uozlv>
<vmuso class=""w20"">20</vmuso>
</rayt>"
"
"
"<rayt>
<gvqbd class=""time"">16:45</gvqbd>
<vmuso class=""na"">-</vmuso>
<uozlv class=""na"">-</uozlv>
<uozlv class=""na"">-</uozlv>
<uozlv class=""w40"">30</uozlv>
<vmuso class=""w20"">5</vmuso>
<uozlv class=""w20"">10</uozlv>
<gvqbd class=""w20"">20</gvqbd>
<vmuso class=""w20"">10</vmuso>
<uozlv class=""w20"">10</uozlv>
<vmuso class=""w20"">20</vmuso>
</rayt>"
"
"
"<rayt>
<vmuso class=""time"">17:15</vmuso>
<vmuso class=""na"">-</vmuso>
<vmuso class=""na"">-</vmuso>
<gvqbd class=""na"">-</gvqbd>
<uozlv class=""w40"">30</uozlv>
<vmuso class=""w20"">5</vmuso>
<uozlv class=""w20"">5</uozlv>
<vmuso class=""w20"">20</vmuso>
<uozlv class=""w20"">10</uozlv>
<vmuso class=""w20"">10</vmuso>
<uozlv class=""w20"">20</uozlv>
</rayt>"
"
"
"<rayt>
<gvqbd class=""time"">17:45</gvqbd>
<vmuso class=""na"">-</vmuso>
<gvqbd class=""w40"">25</gvqbd>
<uozlv class=""na"">-</uozlv>
<uozlv class=""w40"">25</uozlv>
<gvqbd class=""w20"">5</gvqbd>
<vmuso class=""w20"">5</vmuso>
<vmuso class=""w20"">20</vmuso>
<vmuso class=""w20"">10</vmuso>
<gvqbd class=""w20"">10</gvqbd>
<gvqbd class=""w20"">20</gvqbd>
</rayt>"
"
"
"<rayt>
<uozlv class=""time"">18:15</uozlv>
<uozlv class=""na"">-</uozlv>
<vmuso class=""na"">-</vmuso>
<uozlv class=""na"">-</uozlv>
<uozlv class=""w40"">30</uozlv>
<gvqbd class=""w20"">5</gvqbd>
<vmuso class=""w20"">5</vmuso>
<vmuso class=""w20"">20</vmuso>
<uozlv class=""w20"">10</uozlv>
<vmuso class=""w20"">10</vmuso>
<vmuso class=""w20"">20</vmuso>
</rayt>"
"
"
"<rayt>
<vmuso class=""time"">18:45</vmuso>
<gvqbd class=""na"">-</gvqbd>
<vmuso class=""na"">-</vmuso>
<gvqbd class=""na"">-</gvqbd>
<gvqbd class=""w40"">30</gvqbd>
<gvqbd class=""w20"">5</gvqbd>
<uozlv class=""w20"">5</uozlv>
<vmuso class=""w20"">20</vmuso>
<vmuso class=""w20"">10</vmuso>
<gvqbd class=""w20"">10</gvqbd>
<uozlv class=""w20"">20</uozlv>
</rayt>"
"
"
"<rayt>
<vmuso class=""time"">19:15</vmuso>
<vmuso class=""na"">-</vmuso>
<vmuso class=""na"">-</vmuso>
<vmuso class=""na"">-</vmuso>
<uozlv class=""w20"">15</uozlv>
<gvqbd class=""w20"">10</gvqbd>
<gvqbd class=""w20"">5</gvqbd>
<gvqbd class=""w20"">20</gvqbd>
<uozlv class=""w20"">10</uozlv>
<uozlv class=""w20"">10</uozlv>
<vmuso class=""w20"">20</vmuso>
</rayt>"
"
"
"<rayt>
<uozlv class=""time"">19:45</uozlv>
<gvqbd class=""na"">-</gvqbd>
<uozlv class=""na"">-</uozlv>
<uozlv class=""na"">-</uozlv>
<vmuso class=""w40"">25</vmuso>
<gvqbd class=""w20"">5</gvqbd>
<gvqbd class=""w20"">5</gvqbd>
<vmuso class=""w20"">20</vmuso>
<vmuso class=""w20"">10</vmuso>
<gvqbd class=""w20"">10</gvqbd>
<vmuso class=""w20"">20</vmuso>
</rayt>"
"
"
"<rayt>
<uozlv class=""time"">20:15</uozlv>
<gvqbd class=""na"">-</gvqbd>
<vmuso class=""na"">-</vmuso>
<uozlv class=""na"">-</uozlv>
<vmuso class=""w20"">10</vmuso>
<vmuso class=""w20"">5</vmuso>
<uozlv class=""w20"">5</uozlv>
<uozlv class=""na"">-</uozlv>
<vmuso class=""w20"">10</vmuso>
<vmuso class=""w20"">5</vmuso>
<gvqbd class=""na"">-</gvqbd>
</rayt>"
"
"
"<rayt>
<uozlv class=""time"">20:45</uozlv>
<uozlv class=""na"">-</uozlv>
<uozlv class=""na"">-</uozlv>
<gvqbd class=""na"">-</gvqbd>
<gvqbd class=""w20"">15</gvqbd>
<gvqbd class=""w20"">5</gvqbd>
<gvqbd class=""w20"">5</gvqbd>
<vmuso class=""na"">-</vmuso>
<gvqbd class=""w20"">10</gvqbd>
<uozlv class=""w20"">10</uozlv>
<uozlv class=""na"">-</uozlv>
</rayt>"
"
"
"<rayt>
<vmuso class=""time"">21:15</vmuso>
<vmuso class=""w20"">10</vmuso>
<vmuso class=""w20"">10</vmuso>
<uozlv class=""na"">-</uozlv>
<gvqbd class=""w20"">15</gvqbd>
<vmuso class=""na"">-</vmuso>
<gvqbd class=""w20"">5</gvqbd>
<uozlv class=""na"">-</uozlv>
<uozlv class=""w20"">10</uozlv>
<gvqbd class=""w20"">5</gvqbd>
<uozlv class=""w20"">10</uozlv>
</rayt>"
"
"
"<rayt>
<vmuso class=""time"">21:45</vmuso>
<vmuso class=""w20"">10</vmuso>
<vmuso class=""w20"">10</vmuso>
<vmuso class=""na"">-</vmuso>
<vmuso class=""w20"">10</vmuso>
<gvqbd class=""na"">-</gvqbd>
<gvqbd class=""w20"">5</gvqbd>
<uozlv class=""na"">-</uozlv>
<uozlv class=""w20"">10</uozlv>
<uozlv class=""w20"">5</uozlv>
<gvqbd class=""w20"">10</gvqbd>
</rayt>"
"
"
このようなデータになっています。
エラーは
TypeError Traceback (most recent call last)
<ipython-input-2-dfea02db3f9f> in <module>()
8 print (html.dtypes)
9 regexp = re.compile("<rayt.*/rayt>")
---> 10 atags = regexp.findall(html)
11 for atag in atags:
12 html = html.replace(atag, "")
TypeError: expected string or bytes-like object
となっています。
表例
a b c d e f g h i j
11:15 - 5 - 30 - 15 - 10 15 -
11:45...
のようにしていただきたいです。