pythonのBeautifulSoupを利用し、特定のwebページ内のリンクのURLを全て表示したいのですが、相対パスを使っているwebページだと、相対パスまで表示されてしまいます。
コード
Python
1from urllib import request 2from bs4 import BeautifulSoup 3 4url=request.urlopen("調べたいURL") 5soup = BeautifulSoup(url,"html.parser") 6for i in soup.find_all("a"): 7 print(i.get("href")) 8
実行例
http://hogehoge~
/hoge1/hoge2/hoge3
http://hogehoge~
htmlの<a>の<href>要素の絶対パスだけを抽出する方法ってありますか?
文字列メソッドのfindを使って力技で解決する方法も考えたんですがもっとシンプルなやり方はないですかね?
Python
1for i in soup.find_all("a"): 2 if str(i).find("http")>0: 3 print(i.get("href"))

回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2016/02/20 07:54