質問編集履歴
6
Twitterでいただいた情報2 追加
title
CHANGED
File without changes
|
body
CHANGED
@@ -94,4 +94,16 @@
|
|
94
94
|
> マイPCに同じ環境を作って試してみました。どうもprint文で文字列をブラウザに出力する際、特定の文字?が含まれていると出力されないようですね。「r.text」を「r.text[0:77342]」のようにして、77342文字目まで出力するようにしたら、出ました。
|
95
95
|
> - [https://twitter.com/koma_neko/status/992409734496927744](https://twitter.com/koma_neko/status/992409734496927744)
|
96
96
|
|
97
|
-
同様に記述したところ、確かに出力されました。「»」という文字にひっかかるまでは…
|
97
|
+
同様に記述したところ、確かに出力されました。「»」という文字にひっかかるまでは…
|
98
|
+
|
99
|
+
## Twitterでいただいた情報2
|
100
|
+
|
101
|
+
> こちらの環境で例外を補足してみたところ、
|
102
|
+
'cp932' codec can't encode character '\xbb' in position 79453: illegal multibyte sequence
|
103
|
+
というエラーが確認されました。
|
104
|
+
軽く調べてみた感じ、Windows環境ではprintの際に内部で自動的に「CP932」というコードへ変換されるらしく、
|
105
|
+
その際に変換できない文字が含まれていると例外が発生するようです。
|
106
|
+
とりあえず
|
107
|
+
print(r.text.encode('cp932', "ignore").decode('utf-8', "ignore"))
|
108
|
+
とすると変換できない文字は無視するので、何かしら表示できるようになりますが、無視して良いものかどうかは私には判断できません。
|
109
|
+
> - [https://twitter.com/koma_neko/status/992627447060287491](https://twitter.com/koma_neko/status/992627447060287491)
|
5
これまでの経緯に基づく、タイトルの変更
title
CHANGED
@@ -1,1 +1,1 @@
|
|
1
|
-
|
1
|
+
Python requestsで、取り込んだHTMLが全文が出力されません。
|
body
CHANGED
File without changes
|
4
引用元追加
title
CHANGED
File without changes
|
body
CHANGED
@@ -92,5 +92,6 @@
|
|
92
92
|
## Twitterでいただいた情報
|
93
93
|
|
94
94
|
> マイPCに同じ環境を作って試してみました。どうもprint文で文字列をブラウザに出力する際、特定の文字?が含まれていると出力されないようですね。「r.text」を「r.text[0:77342]」のようにして、77342文字目まで出力するようにしたら、出ました。
|
95
|
+
> - [https://twitter.com/koma_neko/status/992409734496927744](https://twitter.com/koma_neko/status/992409734496927744)
|
95
96
|
|
96
97
|
同様に記述したところ、確かに出力されました。「»」という文字にひっかかるまでは…
|
3
Twitterでいただいた情報追加
title
CHANGED
File without changes
|
body
CHANGED
@@ -87,4 +87,10 @@
|
|
87
87
|
|
88
88
|
・python-3.6.5.amd64
|
89
89
|
・http://localhost:8020 ルートディレクトリで実行
|
90
|
-
・XAMPPで実行
|
90
|
+
・XAMPPで実行
|
91
|
+
|
92
|
+
## Twitterでいただいた情報
|
93
|
+
|
94
|
+
> マイPCに同じ環境を作って試してみました。どうもprint文で文字列をブラウザに出力する際、特定の文字?が含まれていると出力されないようですね。「r.text」を「r.text[0:77342]」のようにして、77342文字目まで出力するようにしたら、出ました。
|
95
|
+
|
96
|
+
同様に記述したところ、確かに出力されました。「»」という文字にひっかかるまでは…
|
2
微修正
title
CHANGED
File without changes
|
body
CHANGED
@@ -41,10 +41,11 @@
|
|
41
41
|
UTF-8
|
42
42
|
```
|
43
43
|
|
44
|
+
###やってみたこと
|
45
|
+
|
44
|
-
|
46
|
+
```
|
45
47
|
#!C:\Program Files\WinPython\python-3.6.5.amd64\python.exe
|
46
48
|
# -*- coding: utf-8 -*-
|
47
|
-
```
|
48
49
|
import requests
|
49
50
|
|
50
51
|
url = 'http://yahoo.com/'
|
1
try 500エラー追加
title
CHANGED
File without changes
|
body
CHANGED
@@ -41,6 +41,47 @@
|
|
41
41
|
UTF-8
|
42
42
|
```
|
43
43
|
|
44
|
+
###
|
45
|
+
#!C:\Program Files\WinPython\python-3.6.5.amd64\python.exe
|
46
|
+
# -*- coding: utf-8 -*-
|
47
|
+
```
|
48
|
+
import requests
|
49
|
+
|
50
|
+
url = 'http://yahoo.com/'
|
51
|
+
|
52
|
+
try:
|
53
|
+
|
54
|
+
print("Content-Type: text/plain;charset=utf-8\n\n")
|
55
|
+
|
56
|
+
r = requests.get(url)
|
57
|
+
|
58
|
+
print(r.status_code)
|
59
|
+
|
60
|
+
print(r.headers['content-type'])
|
61
|
+
|
62
|
+
print(r.encoding)
|
63
|
+
|
64
|
+
print(r.text)
|
65
|
+
|
66
|
+
print(r.json())
|
67
|
+
|
68
|
+
print(r.content)
|
69
|
+
|
70
|
+
except Exception as e:
|
71
|
+
print '=== エラー内容 ==='
|
72
|
+
print 'type:' + str(type(e))
|
73
|
+
print 'args:' + str(e.args)
|
74
|
+
print 'message:' + e.message
|
75
|
+
print 'e自身:' + str(e)
|
76
|
+
|
77
|
+
print '処理終了'
|
78
|
+
```
|
79
|
+
⇒**500 error**
|
80
|
+
サーバ内部で障害が発生し、 リクエストに応えることができませんでした。
|
81
|
+
Error message:
|
82
|
+
End of script output before headers: test.py
|
83
|
+
|
84
|
+
|
44
85
|
### 補足情報(FW/ツールのバージョンなど)
|
45
86
|
|
46
87
|
・python-3.6.5.amd64
|