質問するログイン新規登録

回答編集履歴

5

参考の順番を入れ替え

2021/07/12 15:18

投稿

digitalhimiko
digitalhimiko

スコア142

answer CHANGED
@@ -8,6 +8,9 @@
8
8
  ## 2. 調査
9
9
  例えば今回であれば「スクレイピング JavaScript 取れない」等で検索してみると下記の参考に挙げたような参考になるWebサイトがたくさん見つかります。(実際に質問者さんもいろいろと検索して読んでみてください!)
10
10
 
11
+ ※参考1:[[Python] 気象庁からアメダスの最新の気温を取得して利用する](https://mackro.blog.jp/archives/8918213.html)
12
+ ※参考2:[requestsで取得できないWebページをスクレイピングする方法](https://gammasoft.jp/blog/how-to-download-web-page-created-javascript/)
13
+
11
14
  ## 3. 実験
12
15
  一旦、下記のようなスクリプトで値は取得できると思いますので試してみてください。
13
16
  その上でrequests_htmlについて更に自分で調べて勉強してみてください!
@@ -31,7 +34,4 @@
31
34
  print("ans", ans.text) # debug
32
35
  ```
33
36
 
34
- ※参考1:[[Python] 気象庁からアメダスの最新の気温を取得して利用する](https://mackro.blog.jp/archives/8918213.html)
35
- ※参考2:[requestsで取得できないWebページをスクレイピングする方法](https://gammasoft.jp/blog/how-to-download-web-page-created-javascript/)
36
-
37
37
  一旦、これを回答とします。

4

章を追記

2021/07/12 15:18

投稿

digitalhimiko
digitalhimiko

スコア142

answer CHANGED
@@ -1,14 +1,14 @@
1
- まず仮説を立て調べ、実際に試してみる、ということを意識してみましょう。
1
+ まず仮説を立てる、調べ、実際に試してみる、という3つのサイクルを意識してみましょう。
2
2
 
3
- ## 仮説
3
+ ## 1. 仮説
4
4
  おそらくですが取得しようとしているページでHTMLの生成の一部にJavaScriptが使われているからBeatutifulsoupやrequestsで取ってきた(ダウンロードしてきた)HTMLファイルと質問者さんのブラウザで表示されているHTMLが異なっているのだと思います。
5
5
 
6
6
  上記のような仮説を立てたら次はGoogleで検索してたくさん記事を流し読みしましょう。
7
7
 
8
- ## 調査
8
+ ## 2. 調査
9
9
  例えば今回であれば「スクレイピング JavaScript 取れない」等で検索してみると下記の参考に挙げたような参考になるWebサイトがたくさん見つかります。(実際に質問者さんもいろいろと検索して読んでみてください!)
10
10
 
11
- ## 実験
11
+ ## 3. 実験
12
12
  一旦、下記のようなスクリプトで値は取得できると思いますので試してみてください。
13
13
  その上でrequests_htmlについて更に自分で調べて勉強してみてください!
14
14
  ※例えばなぜ下記のスクリプトでsleepを入れいているのか、どういった場合にrequests+Beautifulsoupでなくrequests-htmlを使うほうが良いのか、についても考えてみると勉強になって良いかと!

3

誤記修正

2021/07/12 15:16

投稿

digitalhimiko
digitalhimiko

スコア142

answer CHANGED
@@ -1,9 +1,14 @@
1
+ まず仮説を立てて調べて、実際に試してみる、ということを意識してみましょう。
2
+
3
+ ## 仮説
1
4
  おそらくですが取得しようとしているページでHTMLの生成の一部にJavaScriptが使われているからBeatutifulsoupやrequestsで取ってきた(ダウンロードしてきた)HTMLファイルと質問者さんのブラウザで表示されているHTMLが異なっているのだと思います。
2
5
 
3
- 上記のような仮説を立てたまずGoogleで検索してたくさん記事を流し読みしましょう。
6
+ 上記のような仮説を立てたら次はGoogleで検索してたくさん記事を流し読みしましょう。
4
7
 
8
+ ## 調査
5
9
  例えば今回であれば「スクレイピング JavaScript 取れない」等で検索してみると下記の参考に挙げたような参考になるWebサイトがたくさん見つかります。(実際に質問者さんもいろいろと検索して読んでみてください!)
6
10
 
11
+ ## 実験
7
12
  一旦、下記のようなスクリプトで値は取得できると思いますので試してみてください。
8
13
  その上でrequests_htmlについて更に自分で調べて勉強してみてください!
9
14
  ※例えばなぜ下記のスクリプトでsleepを入れいているのか、どういった場合にrequests+Beautifulsoupでなくrequests-htmlを使うほうが良いのか、についても考えてみると勉強になって良いかと!

2

注記追加

2021/07/12 15:15

投稿

digitalhimiko
digitalhimiko

スコア142

answer CHANGED
@@ -6,6 +6,7 @@
6
6
 
7
7
  一旦、下記のようなスクリプトで値は取得できると思いますので試してみてください。
8
8
  その上でrequests_htmlについて更に自分で調べて勉強してみてください!
9
+ ※例えばなぜ下記のスクリプトでsleepを入れいているのか、どういった場合にrequests+Beautifulsoupでなくrequests-htmlを使うほうが良いのか、についても考えてみると勉強になって良いかと!
9
10
 
10
11
 
11
12
  ```Python

1

誤字修正

2021/07/12 02:43

投稿

digitalhimiko
digitalhimiko

スコア142

answer CHANGED
@@ -1,7 +1,9 @@
1
1
  おそらくですが取得しようとしているページでHTMLの生成の一部にJavaScriptが使われているからBeatutifulsoupやrequestsで取ってきた(ダウンロードしてきた)HTMLファイルと質問者さんのブラウザで表示されているHTMLが異なっているのだと思います。
2
2
 
3
- いっ場合まずGoogleで「スクレイピング JavaScript 取れない」等で検索してみると下記の参考に挙げような参考になるWebサイトがたくさん見つかります。(実際に質問者さんもいろいろと検索んでてください!)
3
+ 上記のよな仮説を立てたまずGoogleで検索してたくさん記事を流し読みしましょう。
4
4
 
5
+ 例えば今回であれば「スクレイピング JavaScript 取れない」等で検索してみると下記の参考に挙げたような参考になるWebサイトがたくさん見つかります。(実際に質問者さんもいろいろと検索して読んでみてください!)
6
+
5
7
  一旦、下記のようなスクリプトで値は取得できると思いますので試してみてください。
6
8
  その上でrequests_htmlについて更に自分で調べて勉強してみてください!
7
9