回答編集履歴

1

URLのエンコードについて追記

2017/09/10 04:02

投稿

miyahan
miyahan

スコア3095

test CHANGED
@@ -7,3 +7,29 @@
7
7
 
8
8
 
9
9
  内容から察するに、Latin-1 (ISO 8859-1) だと思います。
10
+
11
+
12
+
13
+ ---
14
+
15
+
16
+
17
+ 追記:結果ではなくURLに非アルファベット・数字が含まれてるんですね? であればURLを `urllib.parse.quote()` や `urllib.parse.urlencode()` などでエンコードしてください。
18
+
19
+
20
+
21
+ ```python
22
+
23
+ import urllib.parse
24
+
25
+
26
+
27
+ url = 'https://search.goo.ne.jp/web.jsp?' + urllib.parse.urlencode({'MT': 'ñ'})
28
+
29
+ print(urllib.request.urlopen(url).read().decode('utf8'))
30
+
31
+ ```
32
+
33
+
34
+
35
+ 参考:[Python Tips: URL エンコード・デコードがしたい - Life with Python](http://www.lifewithpython.com/2016/07/python-url-encode-decode.html)