Webスクレイピングがしたくて初めてpythonを触るのですが
http://qiita.com/Azunyan1111/items/9b3d16428d2bcc7c9406
を参考にpythonの実行環境を整えpipをDLしファイルを実行してみたのですが
どうもファイルの置く場所が間違っているのかバージョンが違うことからうまくいっていないのかわかりません
日経新聞のサイトからタイトルを取ってくるというものです。
ファイル名はgetNikkeiWebPageTitle.pyとしています。
上記サイトではurllib2を使っているようでしたが私はurllib3を使いました。
(自分のローカルフォルダにurllib3しか見つけることができなかったため)
少々仕様がかわっているようです。
実行すると
C:\Users\MyName\Desktop\Lib\site-packages\pip\_vendor\requests\packages>python getNikkeiWebPageTitle.py Traceback (most recent call last): File "getNikkeiWebPageTitle.py", line 9, in <module> html = urllib3.urlopen(url) AttributeError: module 'urllib3' has no attribute 'urlopen'
となってしまいます。
urlopenという関数をurllib3は持っていません
という意味でしょうか。
どこに問題がありそうですか?
getNikkeiWebPageTitle.pyファイルは
C:\Users\MyName\Desktop\Lib\site-packages\pip_vendor\requests\packages
に置いて実行しています。(あっているか不安)
環境:Windows10,Python 3.6.2rc2,pip 9.0.1
以下実行ファイルです。
getNikkeiWebPageTitle.py
1# coding: UTF-8 2import urllib3 3from bs4 import BeautifulSoup 4 5# アクセスするURL 6url = "http://www.nikkei.com/" 7 8# URLにアクセスする htmlが帰ってくる → <html><head><title>経済、株価、ビジネス、政治のニュース:日経電子版</title></head><body.... 9html = urllib3.urlopen(url) 10 11# htmlをBeautifulSoupで扱う 12soup = BeautifulSoup(html, "html.parser") 13 14# タイトル要素を取得する → <title>経済、株価、ビジネス、政治のニュース:日経電子版</title> 15title_tag = soup.title 16 17# 要素の文字列を取得する → 経済、株価、ビジネス、政治のニュース:日経電子版 18title = title_tag.string 19 20# タイトル要素を出力 21print(title_tag) 22 23# タイトルを文字列を出力 24print(title) 25
具体的な質問ができなくて申し訳ありませんがよろしくお願いします。

回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2017/07/16 01:42