前提・実現したいこと
複数のURL(同サイトの各ページのこと)を末尾だけを別なものにして複数のURLを指定したいです。ちなみに末尾のURLのテキスト(text.txt)は同ディレクトリ内に1行1つのURLとして改行しながら羅列しております。
ファイルを開いて読むという参照コードを参考に自分なりに書いてみました。
該当のソースコード
from
1import urllib.request as req 2 3for line in open('text.txt', 'r'): 4 items = line.split('\n') 5 print line 6 7url = "xxxxxxxxxxxxx" 8res = req.urlopen(url) 9soup = BeautifulSoup(res, 'html.parser') 10title1 = soup.find("h1").string 11print("title = ", title1) 12 13
試したこと
ファイルを開く関数を用いて、ファイル名を指定しました。
それに改行をすることで一つのURLと認識させるように改行のタグを指定しました。
ほとんど手探りでしたがわたしなりに調べてコードを書いてみました...
でもこの後にURLの末尾に取得したtextのURLの末尾を指定したURLと認識させないといけないわけですがそれも難しい現状です...
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2018/06/02 05:38