質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Scrapy

Scrapyは、Pythonで開発されたオープンソースソフトウェアです。スクレイピングという、Webサービスから必要な情報を取り出したり自動操作をしたりする技術を使うものです。

Q&A

解決済

1回答

3848閲覧

windowでのscrapy crawl実行方法に関して

matsunagaaaaa

総合スコア2

スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Scrapy

Scrapyは、Pythonで開発されたオープンソースソフトウェアです。スクレイピングという、Webサービスから必要な情報を取り出したり自動操作をしたりする技術を使うものです。

0グッド

0クリップ

投稿2021/05/23 09:11

プログラミング完全初心者でprogateでpythonの勉強をした後、スクレイピング用の教材を買って勉強しております。

教材をもとにscrapy crawlを実行しようとすると、「Unknown command: crawl Use “scrapy” to see available commands」
というエラーが出てしまいます。
調べてみると「対象のスパイダーのファイルを含むプロジェクト配下で、上記のコマンドを実行していないため」と原因が出てきて、
言ってることは理解できるのですが対象のスパイダーのファイルを含むプロジェクト配下でコマンドを実行する具体的な方法がわかりません。

Visual Studio Codeターミナル上で以下入力して実行しているのですが、そもそもの方法や考え方が間違っているのでしょうか?

[spydersフォルダ内の対象pyファイルパス] scrapy crawl [対象pyファイル名]

正直ptogateで勉強したことと使っている教材内容でレベルの差を感じており、何か自分が知らない概念や知識が教材の前提としてあるのではないかとも感じております。
また恥ずかしながら質問自体も初めてであり、お伝えする必要情報として上記のもので足りているのかもあまりピンと来ていないのですがご教示いただけますと幸いです。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

チュートリアル の How to run our spider の項

https://docs.scrapy.org/en/latest/intro/tutorial.html#how-to-run-our-spider

To put our spider to work, go to the project’s top level directory and run

とあるとおり、カレントディレクトリをプロジェクトのトップレベルディレクトリにしましょう。

チュートリアルで言うと

shell

1scrapy startproject tutorial

のコマンドでできるディレクトリ=以下の構造のtutorialディレクトリのことです。

plain

1tutorial/ 2 scrapy.cfg # deploy configuration file 3 4 tutorial/ # project's Python module, you'll import your code from here 5 __init__.py 6 7 items.py # project items definition file 8 9 middlewares.py # project middlewares file 10 11 pipelines.py # project pipelines file 12 13 settings.py # project settings file 14 15 spiders/ # a directory where you'll later put your spiders 16 __init__.py

投稿2021/05/23 12:01

quickquip

総合スコア11235

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

matsunagaaaaa

2021/05/27 13:15

実行するディレクトリの指定方法がしっかりわかっていなかったのですが、いろいろ方法を試してみたらできました。ありがとうございます。cd <ファイルパス>で出来るのですね。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問