質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Scrapy

Scrapyは、Pythonで開発されたオープンソースソフトウェアです。スクレイピングという、Webサービスから必要な情報を取り出したり自動操作をしたりする技術を使うものです。

Q&A

解決済

2回答

2154閲覧

scrapyの実行エラー

intermission

総合スコア4

Scrapy

Scrapyは、Pythonで開発されたオープンソースソフトウェアです。スクレイピングという、Webサービスから必要な情報を取り出したり自動操作をしたりする技術を使うものです。

0グッド

0クリップ

投稿2020/11/17 05:45

scrapyでプロジェクトを作成した後、crawlを実行しようとしたのですが、下記のようなエラーが出ました。青空文庫のあるhtmlのタイトルタグを抽出するプログラムなのですが、解決方法がわかる方、教えていただけると嬉しいです。

python

1import scrapy 2 3 4class SosekiSpider(scrapy.Spider): 5 name = 'soseki' 6 start_urls = [ 7 'https://www.aozora.gr.jp/index_pages/person148.html' 8 ] 9 10 def parse(self, response): 11 title = response.css('title') 12 print(title.extract()) 13

エラー
(base) C:\Users\rin20\PycharmProjects\pythonProject1\soseki_list\soseki_list\spiders>scrapy crawl soseki --nolog
Unhandled error in Deferred:

Traceback (most recent call last):
File "C:\Users\rin20\anaconda3\lib\site-packages\scrapy\crawler.py", line 192, in crawl
return self._crawl(crawler, *args, **kwargs)
File "C:\Users\rin20\anaconda3\lib\site-packages\scrapy\crawler.py", line 196, in _crawl
d = crawler.crawl(*args, **kwargs)
File "C:\Users\rin20\anaconda3\lib\site-packages\twisted\internet\defer.py", line 1613, in unwindGenerator
return _cancellableInlineCallbacks(gen)
File "C:\Users\rin20\anaconda3\lib\site-packages\twisted\internet\defer.py", line 1529, in _cancellableInlineCallbacks
_inlineCallbacks(None, g, status)
--- <exception caught here> ---
File "C:\Users\rin20\anaconda3\lib\site-packages\twisted\internet\defer.py", line 1418, in _inlineCallbacks
result = g.send(result)
File "C:\Users\rin20\anaconda3\lib\site-packages\scrapy\crawler.py", line 87, in crawl
self.engine = self._create_engine()
File "C:\Users\rin20\anaconda3\lib\site-packages\scrapy\crawler.py", line 101, in _create_engine
return ExecutionEngine(self, lambda : self.stop())
File "C:\Users\rin20\anaconda3\lib\site-packages\scrapy\core\engine.py", line 69, in init
self.downloader = downloader_cls(crawler)
File "C:\Users\rin20\anaconda3\lib\site-packages\scrapy\core\downloader_init
.py", line 83, in init
self.middleware = DownloaderMiddlewareManager.from_crawler(crawler)
File "C:\Users\rin20\anaconda3\lib\site-packages\scrapy\middleware.py", line 53, in from_crawler
return cls.from_settings(crawler.settings, crawler)
File "C:\Users\rin20\anaconda3\lib\site-packages\scrapy\middleware.py", line 35, in from_settings
mw = create_instance(mwcls, settings, crawler)
File "C:\Users\rin20\anaconda3\lib\site-packages\scrapy\utils\misc.py", line 167, in create_instance
instance = objcls.from_crawler(crawler, *args, **kwargs)
File "C:\Users\rin20\anaconda3\lib\site-packages\scrapy\downloadermiddlewares\robotstxt.py", line 36, in from_crawler
return cls(crawler)
File "C:\Users\rin20\anaconda3\lib\site-packages\scrapy\downloadermiddlewares\robotstxt.py", line 32, in init
self._parserimpl.from_crawler(self.crawler, b'')
File "C:\Users\rin20\anaconda3\lib\site-packages\scrapy\robotstxt.py", line 124, in from_crawler
o = cls(robotstxt_body, spider)
File "C:\Users\rin20\anaconda3\lib\site-packages\scrapy\robotstxt.py", line 116, in init
from protego import Protego
builtins.ModuleNotFoundError: No module named 'protego'

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

ベストアンサー

私もwindows10 anaconda環境で
プロンプトでconda install scrapyでインストールしましたが、
builtins.ModuleNotFoundError: No module named 'protego'と同じように最後にでてつまりましたが、protegoのモジュールが見つからないならインストールすればいいのではとおもって
conda install protego
をやったら普通に動きました。
上のpythonもコピペしてコマンドscrapy crawl soseki自分の環境で表示されました。
僕は初心者なので他の方の意見があればそちらを優先したほうがいいと思いますが解答がないようなので書いときます。

投稿2020/12/15 06:43

saburou_inu

総合スコア9

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

intermission

2020/12/17 15:16

ありがとうございます!解決しました。自分も初心者でして汗。頑張りましょう!!
guest

0

私も同じ現象になったので、
scrapyを再インストールしたら解決しました。
原因をしっかりと調べていませんがバージョンの問題かもしれないです。

bash

1python uninstall scrapy 2python install scrapy

投稿2022/01/18 11:38

shortBread2329

総合スコア4

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問