回答編集履歴
8
テキスト修正
test
CHANGED
@@ -2,7 +2,7 @@
|
|
2
2
|
|
3
3
|
|
4
4
|
|
5
|
-
ご質問にあるコード
|
5
|
+
ご質問にあるコードをコピペして検証してみたところ、意図している結果にならない原因は、
|
6
6
|
|
7
7
|
|
8
8
|
|
@@ -14,7 +14,7 @@
|
|
14
14
|
|
15
15
|
|
16
16
|
|
17
|
-
の正規表現 `[^a‐zA‐Z\n]` で使われている二つのハイフン `‐` が、通常のハイフン、すなわちASCIIコード2Dのハイフン`-`**ではなく、** Unicode [U+2010](https://www.fileformat.info/info/unicode/char/2010/index.htm) のハイフンになっていることです。これらを通常の(2Dの)ハイフンに修正してみるといかがでしょうか?
|
17
|
+
の正規表現 `[^a‐zA‐Z\n]` で使われている二つのハイフン `‐` が、通常のハイフン、すなわちASCIIコード2Dのハイフン`-`**ではなく、** Unicode [U+2010](https://www.fileformat.info/info/unicode/char/2010/index.htm) のハイフンになっていることのようです。ですので、これらを通常の(2Dの)ハイフンに修正してみるといかがでしょうか?
|
18
18
|
|
19
19
|
|
20
20
|
|
7
テキスト修正
test
CHANGED
@@ -42,7 +42,7 @@
|
|
42
42
|
|
43
43
|
|
44
44
|
|
45
|
-
以下は、修正前の行をコメントアウトして、
|
45
|
+
以下は、ご質問にあるコードをコピペし、修正前の上記の行をコメントアウトして、通常のハイフンに修正した行に置き換えたサンプルです。
|
46
46
|
|
47
47
|
|
48
48
|
|
6
テキスト修正
test
CHANGED
@@ -2,7 +2,7 @@
|
|
2
2
|
|
3
3
|
|
4
4
|
|
5
|
-
ご質問にあるコード
|
5
|
+
ご質問にあるコードが、意図している結果にならない原因は、
|
6
6
|
|
7
7
|
|
8
8
|
|
5
テキスト修正
test
CHANGED
@@ -14,7 +14,7 @@
|
|
14
14
|
|
15
15
|
|
16
16
|
|
17
|
-
の正規表現 `a‐z
|
17
|
+
の正規表現 `[^a‐zA‐Z\n]` で使われている二つのハイフン `‐` が、通常のハイフン、すなわちASCIIコード2Dのハイフン`-`**ではなく、** Unicode [U+2010](https://www.fileformat.info/info/unicode/char/2010/index.htm) のハイフンになっていることです。これらを通常の(2Dの)ハイフンに修正してみるといかがでしょうか?
|
18
18
|
|
19
19
|
|
20
20
|
|
4
テキスト修正
test
CHANGED
@@ -2,7 +2,7 @@
|
|
2
2
|
|
3
3
|
|
4
4
|
|
5
|
-
ご質問にあるコード
|
5
|
+
ご質問にあるコードで意図した結果にならない原因は、
|
6
6
|
|
7
7
|
|
8
8
|
|
3
テキスト修正
test
CHANGED
@@ -14,7 +14,7 @@
|
|
14
14
|
|
15
15
|
|
16
16
|
|
17
|
-
の正規表現 `a‐z` と `A‐Z` で使われているハイフン `‐` が、通常のハイフン、すなわちASCIIコード2Dのハイフン`-`**ではなく、** Unicode U+2010 のハイフンになっていることです。これらを通常の(2Dの)ハイフンに修正してみるといかがでしょうか?
|
17
|
+
の正規表現 `a‐z` と `A‐Z` で使われているハイフン `‐` が、通常のハイフン、すなわちASCIIコード2Dのハイフン`-`**ではなく、** Unicode [U+2010](https://www.fileformat.info/info/unicode/char/2010/index.htm) のハイフンになっていることです。これらを通常の(2Dの)ハイフンに修正してみるといかがでしょうか?
|
18
18
|
|
19
19
|
|
20
20
|
|
2
テキスト修正
test
CHANGED
@@ -14,7 +14,7 @@
|
|
14
14
|
|
15
15
|
|
16
16
|
|
17
|
-
の正規表現 `a‐z` と `A‐Z` で使われているハイフン `‐` が、通常のハイフン、すなわちASCIIコード2Dのハイフン`-`**ではなく、** Unicode U+2010 のハイフンになって
|
17
|
+
の正規表現 `a‐z` と `A‐Z` で使われているハイフン `‐` が、通常のハイフン、すなわちASCIIコード2Dのハイフン`-`**ではなく、** Unicode U+2010 のハイフンになっていることです。これらを通常の(2Dの)ハイフンに修正してみるといかがでしょうか?
|
18
18
|
|
19
19
|
|
20
20
|
|
1
テキスト修正
test
CHANGED
@@ -19,3 +19,31 @@
|
|
19
19
|
|
20
20
|
|
21
21
|
- **参考:** [ハイフンに似てる文字の文字コード](https://qiita.com/ryounagaoka/items/4cf5191d1a2763667add) ryounagaokaさん@Qiita
|
22
|
+
|
23
|
+
|
24
|
+
|
25
|
+
|
26
|
+
|
27
|
+
### 追記
|
28
|
+
|
29
|
+
|
30
|
+
|
31
|
+
見た目上ほとんど見分けがつきませんが、下記のような修正になります。
|
32
|
+
|
33
|
+
|
34
|
+
|
35
|
+
```diff
|
36
|
+
|
37
|
+
- new_string = re.sub('[^a‐zA‐Z\n]', ' ',new_string)
|
38
|
+
|
39
|
+
+ new_string = re.sub('[^a-zA-Z\n]', ' ',new_string) # 通常のハイフンに修正
|
40
|
+
|
41
|
+
```
|
42
|
+
|
43
|
+
|
44
|
+
|
45
|
+
以下は、修正前の行をコメントアウトして、上記の、通常のハイフンに修正した行に置き換えたサンプルです。
|
46
|
+
|
47
|
+
|
48
|
+
|
49
|
+
- **動作確認用 Repl.it:** [https://repl.it/@jun68ykt/Q297047](https://repl.it/@jun68ykt/Q297047)
|