Visual studioの設定もようやく終わりやっとコードを書き始めました。
まずはこのサイトを写経して勉強しようとしたのですが、つまずきまくっています。。
参考したサイト
python3.5で設定されています。
python
1# -*- coding:utf-8 -*- 2 3import urllib.request 4import codecs 5from bs4 import BeautifulSoup 6 7f = codecs.open('sake.csv') 8f.write('code,meigara,kana,kuramoto,ken,shi' + "\n") 9 10tpl_url='http://www.sakeno.com/all_meigara_todou/{0}' 11headers={'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_5) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/29.0.1547.62 Safari/537.36'} 12 13for i in range( 1, 48): 14 url = tpl_url.format(i) 15 req = urllib.request.Request(url, headers = headers) 16 soup = BeautifulSoup(urllib.request.urlopen(req).read()) 17 tr_arr = soup.find('table',{'class':'hyoji'}).findAll('tr') 18 19 for tr in tr_arr: 20 lrg = tr.find('a').string 21 if lrg is None: 22 continue 23 meigara = lrg.find('a').string 24 code = lrg.a.get("href").split("/")[-1] 25 kana = tr.find('div',{'class':'smls'}).string 26 27 td = tr.find('td',{"class":"smll"}) 28 kuramoto = td.find('strong').find('a').string 29 kenshi = td.findAll('a') 30 ken = kenshi[1].string 31 32 if len( kenshi ) > 2: 33 shi = kenshi[2].string 34 tag = td.text 35 36 else: 37 shi = '' 38 39 if kana is None: 40 kana = '' 41 42 #meigara = maigara.split("(")[0 43 #kuramoto = kuramoto.split("(")[0] 44 45 print(code,meigara,kana,kuramoto,ken,shi) 46 f.write(code + ',' + meigara + ',' + kana + ',' + kuramoto + ',' + ken + ',' + shi + "\n") 47 48f.close
ここの部分
meigara = maigara.split("(")[0]
kuramoto = kuramoto.split("(")[0]
をコメントアウトしないで書くと
line 43
SyntaxError: (unicode error) 'utf-8' codec can't decode byte 0x81 in position 0: invalid start byte
というエラーが出てしまいます。
コメントアウトして行うと
というエラーが出てしまいます。
このエラーの意味がよく分からないので、解決策と合わして教えていただけたら嬉しいです。
長文失礼しました。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。