実現したいこと
教科書でスクレイピングの勉強をしています。
その中で「Docker上にSleniumとPhantomJSの環境を構築して、ブラウザを用いたスクレイピングをする」というところをやっています。
発生している問題・エラーメッセージ
教科書通りにseleniumの環境を構築し、教科書通りのコードを実行しているのですが、うまくいきません。
Traceback (most recent call last): File "selenium-capture.py", line 4, in <module> from selenium import webdriver ImportError: No module named selenium
環境構築をした時のコマンド
$ docker pull ubuntu:16.04 $ docker run -it ubuntu:16.04 # apt-get update # apt-get install -y python3 python3-pip # pip3 install selenium # pip3 install beautifulsoup4 # apt-get install -y wget libfontconfig # mkdir -p /home/root/src && cd $_ # wget https://bitbucket.org/ariya/phantomjs/downloads/phantomjs-2.1.1-linux-x86_64.tar.bz2 # tar jxvf phantomjs-2.1.1-linux-x86_64.tar.bz2 # cd phantomjs-2.1.1-linux-x86_64/bin; cp phantomjs /usr/local/bin # 日本語フォントをインストール # apt-get install -y fonts-migmix # フォント設定を書き換える # cat <<EOF > /etc/fonts/local/conf <?xml version=“1.0”?> <!DOCTYPE fontconfig SYSTEM “fonts.dtd”> <fontconfig> <match target=“pattern”> <test qual=“any” name=“family”> <string>serif</string> </test> <edit name=“family” mode=“assign” binding=“strong”> <string>MigMix 2P</string> </edit> </match> </fontconfig> EOF #環境変数の指定 $ docker run -it -v $HOME:$HOME ¥(逆スラッシュ) -e LANG=ja_JP.UTF_8 ¥ -e PYTHONIOENCODING=utf_8 ¥ ubuntu-phantomjs /bin/bash
###実行したいコード
スクレイピングを行い、あるWebサイトの画面キャプチャをする
Python3
1from selenium import webdriver 2 3url = "http://www.aozora.gr.jp/cards/000081/files/46268_23911.html" 4 5browser = Webdriver.PhantomJS() 6browser.implicitly_wait(3) 7browser.get(url) 8browser.save_screenshot("Website.png") 9browser.quit() 10
補足情報(FW/ツールのバージョンなど)
すみません、どうすれば良いか教えていただけませんか?
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。