beautiful soupのライブラリを使用して、
特定のページ内で、aタグのリンク先をスクレイピングするコードを
試みております。
(言語はpythonで行っております)
実際に実行してみると、以下のようなエラーメッセージが表示されてしまうのですが、
ネットで調べてみてもなかなか解決策を見出せずにおります...
範囲を絞りきれていない中大変恐縮ですが、
下記のコードと、エラーメッセージから、どこを修正すると
問題なく動作するのかどうか、お知恵を頂戴できますと幸いでございます。
よろしくお願いいたします。
ファイル名:beautiful2.py
# -*- coding: utf-8 -*- import urllib2 from bs4 import BeautifulSoup # メイン文 def main(): # 指定されたURLを開く fp = urllib2.urlopen("https://qiita.com/itkr/items/513318a9b5b92bd56185") # URL先のhtml文を取得 html = unicode(fp.read(),"utf-8") fp.close() soup = BeautifulSoup(html,"lxml") # aタグすべて for link in soup.findAll("a"): # リンクを抽出 if ":" in link.get("href"): print( link.get("href") ) if __name__ == '__main__': main()
<ターミナルに表示されているエラーメッセージ>
Traceback (most recent call last): File "beautiful2.py", line 22, in <module> main() File "beautiful2.py", line 18, in main if ":" in link.get("href"): TypeError: argument of type 'NoneType' is not iterable honmayoukinoAir:desktop homma$
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
退会済みユーザー
2017/10/29 10:36