質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

jQuery

jQueryは、JavaScriptライブラリのひとつです。 簡単な記述で、JavaScriptコードを実行できるように設計されています。 2006年1月に、ジョン・レシグが発表しました。 jQueryは独特の記述法を用いており、機能のほとんどは「$関数」や「jQueryオブジェクト」のメソッドとして定義されています。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

4回答

2211閲覧

スクレイピングはどうやって学べばいいか?

moscow3

総合スコア201

スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

jQuery

jQueryは、JavaScriptライブラリのひとつです。 簡単な記述で、JavaScriptコードを実行できるように設計されています。 2006年1月に、ジョン・レシグが発表しました。 jQueryは独特の記述法を用いており、機能のほとんどは「$関数」や「jQueryオブジェクト」のメソッドとして定義されています。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

1クリップ

投稿2017/10/21 18:21

編集2017/10/21 18:39

スクレイピングをしたいと思っていますが、なかなか学習する方法がありません。(言語はjsかpythonを考えています)
gogleで「pythonスクレイピング」 とか、「jquery スクレイピング」とか調べてますが、サンプルコードのコピペだけではうまくいきません。
(たいていは~のファイルが見つかりませんエラーです)

やはり、書籍などを買って基礎から勉強しなくてはいけないのでしょうか?

みなさんは、どのように勉強したかなども教えてほしいです。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答4

0

(たいていは~のファイルが見つかりませんエラーです)

ということは、スクレイピング以前の段階でつまずいているわけなので、まずは書籍でPythonに入門するところから始めるのが良いと思います。
スクレイピングの書籍や、説明サイトでは、その言語を使える人が前提になっていることが多いでしょう。

投稿2017/10/21 22:39

otn

総合スコア84423

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

moscow3

2017/10/21 23:01

なるほど。 確かにまともに使えるのはforとかifくらいですからまだ自分には早かったかもしれませんね。
guest

0

ベストアンサー

スクレピングの基礎学習で、断然おすすなのは本です。

Pythonクローリング&スクレイピング -データ収集・解析のための実践開発ガイド

ネット情報は体系的にまとまっていない場合が多く、断片的な知識にしか手に入りにくいです。「体系化」は自力で行う必要があります。
また、「すでに知識をもった人が読めばわかる」説明が多く、初心者向けに丁寧に説明した情報が本当に少ないです。

紙の本だとコピペはできませんが、Kindle版をダウンロードして、Kindleアプリを使えば、コピペもできますよ。

ただし、プログラミングは、お手本どおり、コピーしても、必ずしもすんなり動くとは限りません。ちょっとした環境の違いで動かなくなるなど日常茶飯事です。

投稿2017/10/21 18:38

編集2017/10/21 18:47
taktaktak

総合スコア349

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

「コピペだけではうまくいきません。」それこそが勉強のタネです。

うかくいかないというが、具体的に何が「うまくいってない」のでしょうか。エラーが出ている? 一見動いているようだがお手本に書いているのと違う結果がでている? お手本はどういう仮定で書いてある? それと自分の状況との間で違っているのはどの要素? こういうことを徹底的に突き詰めてこそプログラムの書き方が理解できるというものです。

突き詰める過程でどのような手法が有効かは、ケースバイケースです。教科書を読み込むことが有効かもしれないし、自分なりに簡単なプログラムを書いてみることが有効かもしれないし、teratailに質問を投げてボコボコにやられることが有効かもしれません。

いずれにせよ、コピペ→うまくいった→OK、次のコピペでは、いつまでたっても勉強ができたことにはならないでしょう。

投稿2017/10/21 18:35

KojiDoi

総合スコア13669

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

moscow3

2017/10/21 18:38

・・・まあそうですね。 たいていは ~のファイルが見つかりません。なので、やっぱり教科書で勉強するのが一番な感じはします。
guest

0

python web スクレイピング

python web crawler
などでさがしてみました。

英語のページの結果参照することをお勧めします。

  • PythonでWebスクレイピングする時の知見をまとめておく

http://vaaaaaanquish.hatenablog.com/entry/2017/06/25/202924

  • Python Webスクレイピング 実践入門

https://qiita.com/Azunyan1111/items/9b3d16428d2bcc7c9406

  • Develop your first web crawler in Python Scrapy

https://medium.com/python-pandemonium/develop-your-first-web-crawler-in-python-scrapy-6b2ee4baf954

  • Web Scraping in Python using Scrapy (with multiple examples)

https://www.analyticsvidhya.com/blog/2017/07/web-scraping-in-python-using-scrapy/

投稿2017/10/21 19:00

katoy

総合スコア22324

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問