https://syllabusView?syllabusYear=2020&syllabusNo=K1-152&kougicd=0004552&request_locale=ja
K1-153&kougicd=0004553
K1-154&kougicd=0004554
K1-155&kougicd=0004555
.....
K1-164&kougicd=0004564
.....
このようにURL内の数字を変えながらスクレイピングしていきたいです。可能なのでしょうか。
1つのwebサイトからurlを取得してきてスクレイピングする作業ができ、ループで同じように複数のurlから取得したいです。urlは末だけ異なるものです。ヒントをください。
import requests from bs4 import BeautifulSoup # Webページを取得して解析する for i in range(3): url = "https://portal.kyoto-wu.ac.jp/Syllabus/syllabusView?syllabusYear=2020&syllabusNo=K1-{153 + i}&kougicd=' + f'{4553 + i}'" html = requests.get(url) soup = BeautifulSoup(html.content,"html.parser") #AttributeError: 'Response' object has no attribute 'contents' for script in soup(["script", "style"]):#スクリプトやスタイルを含む要素を取り除く script.decompose() #.decompose()は、削除のメソッド #print(soup) text=soup.get_text()#テキストのみ=タグ取り #print(text) #タグなし、空白あり lines= [line.strip() for line in text.splitlines()] text="\n".join(line for line in lines if line) print(text)#空白、タグなし
思うような結果がでませんでした。どうなっているのでしょうか。
回答3件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。