###株価情報を取得したい
日本経済新聞のサイトから株価を取得して数値だけ抜き出そうと思っているんですがなかなかうまく行きません
どうしたら良いでしょうか
プログラミング初心者なのでできたら分かりやすく教えていただけますか
###エラーメッセージ
"C:\Program Files\Python36\python.exe" C:/Users/私のユーザー名/PycharmProjects/untitled1/venv/nikkei-io.py File "C:/Users/私のユーザー名/PycharmProjects/untitled1/venv/nikkei-io.py", line 17 if string_ in "class="m-stockPriceElm_value now": ^ SyntaxError: invalid syntax Process finished with exit code 1
###該当のソースコード
Python
1#coding: UTF-8 2import urllib.request 3from bs4 import BeautifulSoup 4 5url = "https://www.nikkei.com/nkd/company/?scode=6916" 6 7html = urllib.request.urlopen(url) 8 9soup = BeautifulSoup(html, "html.parser") 10 11dd = soup.find_all("dd") 12 13for tag in dd: 14 15 try: 16 string_ = tag.get("class").pop(0) 17 if string_ in "class="m-stockPriceElm_value now": 18 title_tag = tag string 19 break 20 except: 21 22 pass 23 24print(title_tag) 25
###その前にやったこと
Python
1#coding: UTF-8 2import urllib.request 3from bs4 import BeautifulSoup 4 5url = "https://www.nikkei.com/nkd/company/?scode=6916" 6 7html = urllib.request.urlopen(url) 8 9soup = BeautifulSoup(html, "html.parser") 10 11title_tag = soup.dd 12 13print(title_tag)
でスクレイピングをすると
"C:\Program Files\Python36\python.exe" C:/Users/私のユーザー名/PycharmProjects/untitled1/venv/nikkei_io_test2.py <dd class="m-stockPriceElm_value now">1,113<span class="m-stockPriceElm_value_unit"> 円</span></dd> Process finished with exit code 0
と上記のような結果になります
数値だけ抜き出す場合どうしたら良いでしょうか
###補足情報(言語/FW/ツール等のバージョンなど)
Windows8.1
Python3.6.3
Pycharm
上記のプログラムで使っているサイト
日本経済新聞 アイ・オー・データ機器 株価
https://www.nikkei.com/nkd/company/?scode=6916
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2018/01/13 04:57
退会済みユーザー
2018/01/14 01:46
2018/01/14 13:40