質問編集履歴
4
微調整しました。
title
CHANGED
File without changes
|
body
CHANGED
@@ -52,7 +52,7 @@
|
|
52
52
|
|
53
53
|
と言っても
|
54
54
|
```lang-python
|
55
|
-
comments = u"絵文字など????" # commentsの中身は上記のコードでの結果
|
55
|
+
comments = u"絵文字など????" # 実際のcommentsの中身は上記のコードでの結果
|
56
56
|
|
57
57
|
print(comments)
|
58
58
|
```
|
3
最初のコードと追加したコードに関係性を持たせました。
title
CHANGED
File without changes
|
body
CHANGED
@@ -52,9 +52,9 @@
|
|
52
52
|
|
53
53
|
と言っても
|
54
54
|
```lang-python
|
55
|
-
|
55
|
+
comments = u"絵文字など????" # commentsの中身は上記のコードでの結果
|
56
56
|
|
57
|
-
print(
|
57
|
+
print(comments)
|
58
58
|
```
|
59
59
|
|
60
60
|
といった程度のことです。
|
2
追記しました。
title
CHANGED
File without changes
|
body
CHANGED
@@ -3,7 +3,7 @@
|
|
3
3
|
python3とseleniumを使ってwebサイトをスクレイピングしていました。
|
4
4
|
|
5
5
|
ユニコード文字列をlxml.htmlで取って来た要素に対して、
|
6
|
-
```
|
6
|
+
```lang-python
|
7
7
|
comments = u""
|
8
8
|
comments_elem = root.xpath('//li[@class="hoge"]/span')
|
9
9
|
for i,comment_elem in enumerate(comments_elem):
|
@@ -13,7 +13,7 @@
|
|
13
13
|
|
14
14
|
途中に絵文字等が入っていたらしく、
|
15
15
|
|
16
|
-
```
|
16
|
+
```lang-python
|
17
17
|
UnicodeEncodeError: 'UCS-2' codec can't encode characters in position 3898-3898: Non-BMP character not supported in Tk
|
18
18
|
```
|
19
19
|
というエラーが出てきました。
|
@@ -27,7 +27,7 @@
|
|
27
27
|
http://d.hatena.ne.jp/nishiohirokazu/20120112/1326355987
|
28
28
|
|
29
29
|
新たに
|
30
|
-
```
|
30
|
+
```lang-python
|
31
31
|
....
|
32
32
|
File "/Library/Frameworks/Python.framework/Versions/3.6/lib/python3.6/codecs.py", line 377, in write
|
33
33
|
self.stream.write(data)
|
@@ -43,4 +43,24 @@
|
|
43
43
|
容量の関係で更新できずosは若干古いですが、
|
44
44
|
本題とはあまり関係ないと思ってます。
|
45
45
|
|
46
|
-
回答よろしくお願いします。m(_ _)m
|
46
|
+
回答よろしくお願いします。m(_ _)m
|
47
|
+
|
48
|
+
###追記
|
49
|
+
|
50
|
+
ご指摘を受けました
|
51
|
+
自己解決欄に書いたprint関数の部分について、です。
|
52
|
+
|
53
|
+
と言っても
|
54
|
+
```lang-python
|
55
|
+
hoge = u"絵文字など????"
|
56
|
+
|
57
|
+
print(hoge)
|
58
|
+
```
|
59
|
+
|
60
|
+
といった程度のことです。
|
61
|
+
|
62
|
+
ただしどんな絵文字が上記のエラー原因になった(Non-bmpな絵文字と言われた)かは確認できていません。
|
63
|
+
|
64
|
+
自己解決欄に書いたコードに対しその解決方法(.translate等)が適用されていなかったと考えて下さい。
|
65
|
+
|
66
|
+
その他の部分で直接この件に関係するものはおそらくないです。
|
1
初心者マークを入れ忘れていました。
title
CHANGED
File without changes
|
body
CHANGED
File without changes
|