回答編集履歴
3
修正
test
CHANGED
@@ -16,6 +16,6 @@
|
|
16
16
|
|
17
17
|
---
|
18
18
|
|
19
|
-
下記コードでエラーは出ませんでした。(ヘッダー情報はなし)
|
19
|
+
~~下記コードでエラーは出ませんでした。(ヘッダー情報はなし)~~
|
20
20
|
|
21
21
|
~~エラーが出るのはコードの問題ではなく、質問者さんの環境の問題ではないでしょうか?~~
|
2
追記
test
CHANGED
@@ -1,3 +1,15 @@
|
|
1
|
+
【追記】
|
2
|
+
|
3
|
+
Pythonからのアクセスを拒否されるということは、そのサイトは「非ブラウザ」のリクエストを許可しない設定ということでしょう。
|
4
|
+
|
5
|
+
質問者さんのコードが上手くいかないのはおそらくUserAgent部分が正しく書かれていないためと思われます。しかし、サイトはスクレイピングを禁止している可能性があるので止めた方が良いかもしれませんね。
|
6
|
+
|
7
|
+
|
8
|
+
|
9
|
+
---
|
10
|
+
|
11
|
+
|
12
|
+
|
1
13
|
質問者さんの言う「エラー」とは、Pythonのエラーが出るのではなくrequests.get(url).contentの内容が「You don't have permission to access this resource.」であるということなんですね。理解が出来ていませんでした。
|
2
14
|
|
3
15
|
|
@@ -7,27 +19,3 @@
|
|
7
19
|
下記コードでエラーは出ませんでした。(ヘッダー情報はなし)
|
8
20
|
|
9
21
|
~~エラーが出るのはコードの問題ではなく、質問者さんの環境の問題ではないでしょうか?~~
|
10
|
-
|
11
|
-
|
12
|
-
|
13
|
-
|
14
|
-
|
15
|
-
```Python
|
16
|
-
|
17
|
-
from bs4 import BeautifulSoup
|
18
|
-
|
19
|
-
import requests
|
20
|
-
|
21
|
-
import openpyxl
|
22
|
-
|
23
|
-
year = 2019
|
24
|
-
|
25
|
-
code = 6577
|
26
|
-
|
27
|
-
url = "https://kabuoji3.com/stock/"+str(code)+"/"+str(year)+"/"
|
28
|
-
|
29
|
-
soup = BeautifulSoup(requests.get(url).content,'html.parser')
|
30
|
-
|
31
|
-
print(requests.get(url).content)
|
32
|
-
|
33
|
-
```
|
1
追記
test
CHANGED
@@ -1,6 +1,12 @@
|
|
1
|
+
質問者さんの言う「エラー」とは、Pythonのエラーが出るのではなくrequests.get(url).contentの内容が「You don't have permission to access this resource.」であるということなんですね。理解が出来ていませんでした。
|
2
|
+
|
3
|
+
|
4
|
+
|
5
|
+
---
|
6
|
+
|
1
7
|
下記コードでエラーは出ませんでした。(ヘッダー情報はなし)
|
2
8
|
|
3
|
-
エラーが出るのはコードの問題ではなく、質問者さんの環境の問題ではないでしょうか?
|
9
|
+
~~エラーが出るのはコードの問題ではなく、質問者さんの環境の問題ではないでしょうか?~~
|
4
10
|
|
5
11
|
|
6
12
|
|