質問編集履歴
2
一部、「異体字」を「異字体」と書いてしまっていたので、検索しやすいように修正しました。
title
CHANGED
@@ -1,1 +1,1 @@
|
|
1
|
-
異
|
1
|
+
異体字を含むテキストの長さを知りたい
|
body
CHANGED
@@ -19,7 +19,7 @@
|
|
19
19
|
祇
|
20
20
|
```
|
21
21
|
|
22
|
-
`text`変数に入っている最初の漢字は**IVS異体字**であり、次の漢字は通常の字体です。IVS異
|
22
|
+
`text`変数に入っている最初の漢字は**IVS異体字**であり、次の漢字は通常の字体です。IVS異体字は1つで2文字として扱われてしまいます。`encode("unicode-escape")`すると、以下のように文字が分割されてしまい`for`が3周回っていることがわかります。
|
23
23
|
|
24
24
|
```
|
25
25
|
b'\u7947'
|
1
誤字
title
CHANGED
File without changes
|
body
CHANGED
@@ -23,7 +23,7 @@
|
|
23
23
|
|
24
24
|
```
|
25
25
|
b'\u7947'
|
26
|
-
b'\U000e010f' ※異
|
26
|
+
b'\U000e010f' ※異体字セレクター部分
|
27
27
|
b'\u7947'
|
28
28
|
```
|
29
29
|
|