前提・実現したいこと
Python2.7でBeautifulSoup4を使用し、ウェブのスクレイピングのプログラムを作成しています。
HTMLのclassが"hoge"であるdivタグ(複数あります)の中にあるリンクを全て取得したいです。
発生している問題
このサイトを参考にして、aタグの中のhrefを取得すればいいということは分かりました。しかし、それを範囲を指定してする方法が分かりません。find_allでdiv.hogeを取得して一旦代入して、そこからaタグの中のhrefを取得してみようとして、以下のスクリプトを組んだのですが、
python
1div = soup.select("div.tclcon") 2print([a.get("href") for a in div.find_all("a")])
Traceback (most recent call last): File "/home/username/Documents/hoge.py", line 8, in <module> for i in [a.get("href") for a in div.find_all("a")]: AttributeError: 'list' object has no attribute 'find_all'
エラーが出て、型を変えたりして試してみたのですが、変わりませんでした。
どのようにすればいいのか、どなたか教えていただけますか?
補足情報(FW/ツールのバージョンなど)
Ubuntu18.04 LTS
Python2.7.15.rc1
beautifulsoup-3.2.1
requests2.19.1
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2018/07/01 02:58