回答編集履歴
1
表現を修正
answer
CHANGED
@@ -6,4 +6,4 @@
|
|
6
6
|
|
7
7
|
> テキストは正常に取得できるので,たまに現れる絵文字もどうせならimgタグをそのまま取得したいのですが,スクレイピングの際にはimgタグがテキストに変換されているような挙動をしていて,imgタグが消滅しています.
|
8
8
|
|
9
|
-
という理解は間違っており、「文字として書かれた絵文字」(Unicodeコードポイントを符号化したもの)がオリジナルのデータで、それを正常に取得しています。「・」のように表示されるのは、その絵文字のグリフが収録されていないためです。
|
9
|
+
という理解は間違っており、「文字として書かれた絵文字」(Unicodeコードポイントを符号化したもの)がオリジナルのデータで、それを正常に取得しています。「・」のように表示されるのは、その絵文字のグリフが表示に使ったフォントに収録されていないためです。
|