https://kabuoji3.com/stock/1305/2001/
上記のURLの 2001 の部分をfor文で2001~2019まで回して、当該のページにある表を取得するコードを組みました。
ここで得られる表は、以下の画像のようになります。この時それぞれの表を1つに結合してcsvに保存したいと思っておりますが、なかなかアイディアが浮かびません。
以下が今まで作成したコードです。
# coding: utf-8 import pandas as pd from datetime import datetime import csv from bs4 import BeautifulSoup import requests df = pd.read_csv('code1.csv') for i in range(len(df)): url1 = 'https://kabuoji3.com/stock/{}/'.format(df.iat[i, 0]) html1 = requests.get(url1) soup1 = BeautifulSoup(html1.content,'lxml') print(soup1.find("span",class_="jp").string) for ul in soup1.find_all("ul", class_="stock_yselect mt_10"): for a in ul.find_all("a"): if a.decode_contents(formatter="html") != "直近300日": url2 = 'https://kabuoji3.com/stock/{}/{}/'.format(df.iat[i, 0],a.decode_contents(formatter="html")) print(url2) dfs = pd.read_html(url2) print(dfs)
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2019/09/01 14:46
2019/09/01 14:54
2019/09/01 15:05