質問するログイン新規登録

質問編集履歴

6

Twitterでいただいた情報2 追加

2018/05/10 15:44

投稿

BITO
BITO

スコア19

title CHANGED
File without changes
body CHANGED
@@ -94,4 +94,16 @@
94
94
  > マイPCに同じ環境を作って試してみました。どうもprint文で文字列をブラウザに出力する際、特定の文字?が含まれていると出力されないようですね。「r.text」を「r.text[0:77342]」のようにして、77342文字目まで出力するようにしたら、出ました。
95
95
  > - [https://twitter.com/koma_neko/status/992409734496927744](https://twitter.com/koma_neko/status/992409734496927744)
96
96
 
97
- 同様に記述したところ、確かに出力されました。「»」という文字にひっかかるまでは…
97
+ 同様に記述したところ、確かに出力されました。「»」という文字にひっかかるまでは…
98
+
99
+ ## Twitterでいただいた情報2
100
+
101
+ > こちらの環境で例外を補足してみたところ、
102
+ 'cp932' codec can't encode character '\xbb' in position 79453: illegal multibyte sequence
103
+ というエラーが確認されました。
104
+ 軽く調べてみた感じ、Windows環境ではprintの際に内部で自動的に「CP932」というコードへ変換されるらしく、
105
+ その際に変換できない文字が含まれていると例外が発生するようです。
106
+ とりあえず
107
+ print(r.text.encode('cp932', "ignore").decode('utf-8', "ignore"))
108
+ とすると変換できない文字は無視するので、何かしら表示できるようになりますが、無視して良いものかどうかは私には判断できません。
109
+ > - [https://twitter.com/koma_neko/status/992627447060287491](https://twitter.com/koma_neko/status/992627447060287491)

5

これまでの経緯に基づく、タイトルの変更

2018/05/10 15:44

投稿

BITO
BITO

スコア19

title CHANGED
@@ -1,1 +1,1 @@
1
- import requestsがくいきません。
1
+ Python requestsで、取り込んだHTML全文が出力されません。
body CHANGED
File without changes

4

引用元追加

2018/05/04 16:01

投稿

BITO
BITO

スコア19

title CHANGED
File without changes
body CHANGED
@@ -92,5 +92,6 @@
92
92
  ## Twitterでいただいた情報
93
93
 
94
94
  > マイPCに同じ環境を作って試してみました。どうもprint文で文字列をブラウザに出力する際、特定の文字?が含まれていると出力されないようですね。「r.text」を「r.text[0:77342]」のようにして、77342文字目まで出力するようにしたら、出ました。
95
+ > - [https://twitter.com/koma_neko/status/992409734496927744](https://twitter.com/koma_neko/status/992409734496927744)
95
96
 
96
97
  同様に記述したところ、確かに出力されました。「»」という文字にひっかかるまでは…

3

Twitterでいただいた情報追加

2018/05/04 14:34

投稿

BITO
BITO

スコア19

title CHANGED
File without changes
body CHANGED
@@ -87,4 +87,10 @@
87
87
 
88
88
  ・python-3.6.5.amd64
89
89
  ・http://localhost:8020 ルートディレクトリで実行
90
- ・XAMPPで実行
90
+ ・XAMPPで実行
91
+
92
+ ## Twitterでいただいた情報
93
+
94
+ > マイPCに同じ環境を作って試してみました。どうもprint文で文字列をブラウザに出力する際、特定の文字?が含まれていると出力されないようですね。「r.text」を「r.text[0:77342]」のようにして、77342文字目まで出力するようにしたら、出ました。
95
+
96
+ 同様に記述したところ、確かに出力されました。「»」という文字にひっかかるまでは…

2

微修正

2018/05/04 14:32

投稿

BITO
BITO

スコア19

title CHANGED
File without changes
body CHANGED
@@ -41,10 +41,11 @@
41
41
  UTF-8
42
42
  ```
43
43
 
44
+ ###やってみたこと
45
+
44
- ###
46
+ ```
45
47
  #!C:\Program Files\WinPython\python-3.6.5.amd64\python.exe
46
48
  # -*- coding: utf-8 -*-
47
- ```
48
49
  import requests
49
50
 
50
51
  url = 'http://yahoo.com/'

1

try 500エラー追加

2018/05/04 14:03

投稿

BITO
BITO

スコア19

title CHANGED
File without changes
body CHANGED
@@ -41,6 +41,47 @@
41
41
  UTF-8
42
42
  ```
43
43
 
44
+ ###
45
+ #!C:\Program Files\WinPython\python-3.6.5.amd64\python.exe
46
+ # -*- coding: utf-8 -*-
47
+ ```
48
+ import requests
49
+
50
+ url = 'http://yahoo.com/'
51
+
52
+ try:
53
+
54
+ print("Content-Type: text/plain;charset=utf-8\n\n")
55
+
56
+ r = requests.get(url)
57
+
58
+ print(r.status_code)
59
+
60
+ print(r.headers['content-type'])
61
+
62
+ print(r.encoding)
63
+
64
+ print(r.text)
65
+
66
+ print(r.json())
67
+
68
+ print(r.content)
69
+
70
+ except Exception as e:
71
+ print '=== エラー内容 ==='
72
+ print 'type:' + str(type(e))
73
+ print 'args:' + str(e.args)
74
+ print 'message:' + e.message
75
+ print 'e自身:' + str(e)
76
+
77
+ print '処理終了'
78
+ ```
79
+ ⇒**500 error**
80
+  サーバ内部で障害が発生し、 リクエストに応えることができませんでした。
81
+  Error message:
82
+  End of script output before headers: test.py
83
+
84
+
44
85
  ### 補足情報(FW/ツールのバージョンなど)
45
86
 
46
87
  ・python-3.6.5.amd64