前提・実現したいこと
該当のソースコードのhttps://www.yahoo.co.jpの部分をurl.txtファイルから順番に読み込みたいです。
url.txtファイルの内容は
https://www.yahoo.co.jp
https://www.google.com/
https://www.amazon.co.jp/
https://www.apple.com/
のようなURLの羅列です。
つまり、
https://www.yahoo.co.jpで実行したら
https://www.google.com/で実行し
https://www.amazon.co.jp/で実行し
https://www.apple.com/で実行し
実行内容で取得したURLをまとめてlist.txtに書き出したいです。
発生している問題・エラーメッセージ
どのようにコードを書けばよいでしょうか?
該当のソースコード
import requests
from bs4 import BeautifulSoup
import urllib
import openpyxl
load_url = "https://www.yahoo.co.jp"
html = requests.get(load_url)
soup = BeautifulSoup(html.content, "html.parser")
List = soup.find(class_="List")
filename="list.txt"
with open(filename, "a") as f:
for element in castList.find_all("a"): url = element.get("href") link_url = urllib.parse.urljoin(load_url, url) f.write(link_url+"\n")
試したこと
ググって関数など定義していろいろ調べて試したのですが、うまくできません。
補足情報(FW/ツールのバージョンなど)
プログラム経験1週間。python初心者です。よろしくお願いいたします。
あなたの回答
tips
プレビュー