回答編集履歴
5
参考の順番を入れ替え
answer
CHANGED
@@ -8,6 +8,9 @@
|
|
8
8
|
## 2. 調査
|
9
9
|
例えば今回であれば「スクレイピング JavaScript 取れない」等で検索してみると下記の参考に挙げたような参考になるWebサイトがたくさん見つかります。(実際に質問者さんもいろいろと検索して読んでみてください!)
|
10
10
|
|
11
|
+
※参考1:[[Python] 気象庁からアメダスの最新の気温を取得して利用する](https://mackro.blog.jp/archives/8918213.html)
|
12
|
+
※参考2:[requestsで取得できないWebページをスクレイピングする方法](https://gammasoft.jp/blog/how-to-download-web-page-created-javascript/)
|
13
|
+
|
11
14
|
## 3. 実験
|
12
15
|
一旦、下記のようなスクリプトで値は取得できると思いますので試してみてください。
|
13
16
|
その上でrequests_htmlについて更に自分で調べて勉強してみてください!
|
@@ -31,7 +34,4 @@
|
|
31
34
|
print("ans", ans.text) # debug
|
32
35
|
```
|
33
36
|
|
34
|
-
※参考1:[[Python] 気象庁からアメダスの最新の気温を取得して利用する](https://mackro.blog.jp/archives/8918213.html)
|
35
|
-
※参考2:[requestsで取得できないWebページをスクレイピングする方法](https://gammasoft.jp/blog/how-to-download-web-page-created-javascript/)
|
36
|
-
|
37
37
|
一旦、これを回答とします。
|
4
章を追記
answer
CHANGED
@@ -1,14 +1,14 @@
|
|
1
|
-
まず仮説を立て
|
1
|
+
まず仮説を立てる、調べる、実際に試してみる、という3つのサイクルを意識してみましょう。
|
2
2
|
|
3
|
-
## 仮説
|
3
|
+
## 1. 仮説
|
4
4
|
おそらくですが取得しようとしているページでHTMLの生成の一部にJavaScriptが使われているからBeatutifulsoupやrequestsで取ってきた(ダウンロードしてきた)HTMLファイルと質問者さんのブラウザで表示されているHTMLが異なっているのだと思います。
|
5
5
|
|
6
6
|
上記のような仮説を立てたら次はGoogleで検索してたくさん記事を流し読みしましょう。
|
7
7
|
|
8
|
-
## 調査
|
8
|
+
## 2. 調査
|
9
9
|
例えば今回であれば「スクレイピング JavaScript 取れない」等で検索してみると下記の参考に挙げたような参考になるWebサイトがたくさん見つかります。(実際に質問者さんもいろいろと検索して読んでみてください!)
|
10
10
|
|
11
|
-
## 実験
|
11
|
+
## 3. 実験
|
12
12
|
一旦、下記のようなスクリプトで値は取得できると思いますので試してみてください。
|
13
13
|
その上でrequests_htmlについて更に自分で調べて勉強してみてください!
|
14
14
|
※例えばなぜ下記のスクリプトでsleepを入れいているのか、どういった場合にrequests+Beautifulsoupでなくrequests-htmlを使うほうが良いのか、についても考えてみると勉強になって良いかと!
|
3
誤記修正
answer
CHANGED
@@ -1,9 +1,14 @@
|
|
1
|
+
まず仮説を立てて調べて、実際に試してみる、ということを意識してみましょう。
|
2
|
+
|
3
|
+
## 仮説
|
1
4
|
おそらくですが取得しようとしているページでHTMLの生成の一部にJavaScriptが使われているからBeatutifulsoupやrequestsで取ってきた(ダウンロードしてきた)HTMLファイルと質問者さんのブラウザで表示されているHTMLが異なっているのだと思います。
|
2
5
|
|
3
|
-
上記のような仮説を立てた
|
6
|
+
上記のような仮説を立てたら次はGoogleで検索してたくさん記事を流し読みしましょう。
|
4
7
|
|
8
|
+
## 調査
|
5
9
|
例えば今回であれば「スクレイピング JavaScript 取れない」等で検索してみると下記の参考に挙げたような参考になるWebサイトがたくさん見つかります。(実際に質問者さんもいろいろと検索して読んでみてください!)
|
6
10
|
|
11
|
+
## 実験
|
7
12
|
一旦、下記のようなスクリプトで値は取得できると思いますので試してみてください。
|
8
13
|
その上でrequests_htmlについて更に自分で調べて勉強してみてください!
|
9
14
|
※例えばなぜ下記のスクリプトでsleepを入れいているのか、どういった場合にrequests+Beautifulsoupでなくrequests-htmlを使うほうが良いのか、についても考えてみると勉強になって良いかと!
|
2
注記追加
answer
CHANGED
@@ -6,6 +6,7 @@
|
|
6
6
|
|
7
7
|
一旦、下記のようなスクリプトで値は取得できると思いますので試してみてください。
|
8
8
|
その上でrequests_htmlについて更に自分で調べて勉強してみてください!
|
9
|
+
※例えばなぜ下記のスクリプトでsleepを入れいているのか、どういった場合にrequests+Beautifulsoupでなくrequests-htmlを使うほうが良いのか、についても考えてみると勉強になって良いかと!
|
9
10
|
|
10
11
|
|
11
12
|
```Python
|
1
誤字修正
answer
CHANGED
@@ -1,7 +1,9 @@
|
|
1
1
|
おそらくですが取得しようとしているページでHTMLの生成の一部にJavaScriptが使われているからBeatutifulsoupやrequestsで取ってきた(ダウンロードしてきた)HTMLファイルと質問者さんのブラウザで表示されているHTMLが異なっているのだと思います。
|
2
2
|
|
3
|
-
|
3
|
+
上記のような仮説を立てたまずGoogleで検索してたくさん記事を流し読みしましょう。
|
4
4
|
|
5
|
+
例えば今回であれば「スクレイピング JavaScript 取れない」等で検索してみると下記の参考に挙げたような参考になるWebサイトがたくさん見つかります。(実際に質問者さんもいろいろと検索して読んでみてください!)
|
6
|
+
|
5
7
|
一旦、下記のようなスクリプトで値は取得できると思いますので試してみてください。
|
6
8
|
その上でrequests_htmlについて更に自分で調べて勉強してみてください!
|
7
9
|
|