回答編集履歴
8
テキスト修正
answer
CHANGED
@@ -1,12 +1,12 @@
|
|
1
1
|
こんにちは
|
2
2
|
|
3
|
-
ご質問にあるコード
|
3
|
+
ご質問にあるコードをコピペして検証してみたところ、意図している結果にならない原因は、
|
4
4
|
|
5
5
|
```python
|
6
6
|
new_string = re.sub('[^a‐zA‐Z\n]', ' ',new_string)
|
7
7
|
```
|
8
8
|
|
9
|
-
の正規表現 `[^a‐zA‐Z\n]` で使われている二つのハイフン `‐` が、通常のハイフン、すなわちASCIIコード2Dのハイフン`-`**ではなく、** Unicode [U+2010](https://www.fileformat.info/info/unicode/char/2010/index.htm) のハイフンになっていることです。これらを通常の(2Dの)ハイフンに修正してみるといかがでしょうか?
|
9
|
+
の正規表現 `[^a‐zA‐Z\n]` で使われている二つのハイフン `‐` が、通常のハイフン、すなわちASCIIコード2Dのハイフン`-`**ではなく、** Unicode [U+2010](https://www.fileformat.info/info/unicode/char/2010/index.htm) のハイフンになっていることのようです。ですので、これらを通常の(2Dの)ハイフンに修正してみるといかがでしょうか?
|
10
10
|
|
11
11
|
- **参考:** [ハイフンに似てる文字の文字コード](https://qiita.com/ryounagaoka/items/4cf5191d1a2763667add) ryounagaokaさん@Qiita
|
12
12
|
|
7
テキスト修正
answer
CHANGED
@@ -20,6 +20,6 @@
|
|
20
20
|
+ new_string = re.sub('[^a-zA-Z\n]', ' ',new_string) # 通常のハイフンに修正
|
21
21
|
```
|
22
22
|
|
23
|
-
以下は、修正前の行をコメントアウトして、
|
23
|
+
以下は、ご質問にあるコードをコピペし、修正前の上記の行をコメントアウトして、通常のハイフンに修正した行に置き換えたサンプルです。
|
24
24
|
|
25
25
|
- **動作確認用 Repl.it:** [https://repl.it/@jun68ykt/Q297047](https://repl.it/@jun68ykt/Q297047)
|
6
テキスト修正
answer
CHANGED
@@ -1,6 +1,6 @@
|
|
1
1
|
こんにちは
|
2
2
|
|
3
|
-
ご質問にあるコード
|
3
|
+
ご質問にあるコードが、意図している結果にならない原因は、
|
4
4
|
|
5
5
|
```python
|
6
6
|
new_string = re.sub('[^a‐zA‐Z\n]', ' ',new_string)
|
5
テキスト修正
answer
CHANGED
@@ -6,7 +6,7 @@
|
|
6
6
|
new_string = re.sub('[^a‐zA‐Z\n]', ' ',new_string)
|
7
7
|
```
|
8
8
|
|
9
|
-
の正規表現 `a‐
|
9
|
+
の正規表現 `[^a‐zA‐Z\n]` で使われている二つのハイフン `‐` が、通常のハイフン、すなわちASCIIコード2Dのハイフン`-`**ではなく、** Unicode [U+2010](https://www.fileformat.info/info/unicode/char/2010/index.htm) のハイフンになっていることです。これらを通常の(2Dの)ハイフンに修正してみるといかがでしょうか?
|
10
10
|
|
11
11
|
- **参考:** [ハイフンに似てる文字の文字コード](https://qiita.com/ryounagaoka/items/4cf5191d1a2763667add) ryounagaokaさん@Qiita
|
12
12
|
|
4
テキスト修正
answer
CHANGED
@@ -1,6 +1,6 @@
|
|
1
1
|
こんにちは
|
2
2
|
|
3
|
-
ご質問にあるコード
|
3
|
+
ご質問にあるコードで意図した結果にならない原因は、
|
4
4
|
|
5
5
|
```python
|
6
6
|
new_string = re.sub('[^a‐zA‐Z\n]', ' ',new_string)
|
3
テキスト修正
answer
CHANGED
@@ -6,7 +6,7 @@
|
|
6
6
|
new_string = re.sub('[^a‐zA‐Z\n]', ' ',new_string)
|
7
7
|
```
|
8
8
|
|
9
|
-
の正規表現 `a‐z` と `A‐Z` で使われているハイフン `‐` が、通常のハイフン、すなわちASCIIコード2Dのハイフン`-`**ではなく、** Unicode U+2010 のハイフンになっていることです。これらを通常の(2Dの)ハイフンに修正してみるといかがでしょうか?
|
9
|
+
の正規表現 `a‐z` と `A‐Z` で使われているハイフン `‐` が、通常のハイフン、すなわちASCIIコード2Dのハイフン`-`**ではなく、** Unicode [U+2010](https://www.fileformat.info/info/unicode/char/2010/index.htm) のハイフンになっていることです。これらを通常の(2Dの)ハイフンに修正してみるといかがでしょうか?
|
10
10
|
|
11
11
|
- **参考:** [ハイフンに似てる文字の文字コード](https://qiita.com/ryounagaoka/items/4cf5191d1a2763667add) ryounagaokaさん@Qiita
|
12
12
|
|
2
テキスト修正
answer
CHANGED
@@ -6,7 +6,7 @@
|
|
6
6
|
new_string = re.sub('[^a‐zA‐Z\n]', ' ',new_string)
|
7
7
|
```
|
8
8
|
|
9
|
-
の正規表現 `a‐z` と `A‐Z` で使われているハイフン `‐` が、通常のハイフン、すなわちASCIIコード2Dのハイフン`-`**ではなく、** Unicode U+2010 のハイフンになって
|
9
|
+
の正規表現 `a‐z` と `A‐Z` で使われているハイフン `‐` が、通常のハイフン、すなわちASCIIコード2Dのハイフン`-`**ではなく、** Unicode U+2010 のハイフンになっていることです。これらを通常の(2Dの)ハイフンに修正してみるといかがでしょうか?
|
10
10
|
|
11
11
|
- **参考:** [ハイフンに似てる文字の文字コード](https://qiita.com/ryounagaoka/items/4cf5191d1a2763667add) ryounagaokaさん@Qiita
|
12
12
|
|
1
テキスト修正
answer
CHANGED
@@ -8,4 +8,18 @@
|
|
8
8
|
|
9
9
|
の正規表現 `a‐z` と `A‐Z` で使われているハイフン `‐` が、通常のハイフン、すなわちASCIIコード2Dのハイフン`-`**ではなく、** Unicode U+2010 のハイフンになってしまっているようです。これらを通常の(2Dの)ハイフンに修正してみるといかがでしょうか?
|
10
10
|
|
11
|
-
- **参考:** [ハイフンに似てる文字の文字コード](https://qiita.com/ryounagaoka/items/4cf5191d1a2763667add) ryounagaokaさん@Qiita
|
11
|
+
- **参考:** [ハイフンに似てる文字の文字コード](https://qiita.com/ryounagaoka/items/4cf5191d1a2763667add) ryounagaokaさん@Qiita
|
12
|
+
|
13
|
+
|
14
|
+
### 追記
|
15
|
+
|
16
|
+
見た目上ほとんど見分けがつきませんが、下記のような修正になります。
|
17
|
+
|
18
|
+
```diff
|
19
|
+
- new_string = re.sub('[^a‐zA‐Z\n]', ' ',new_string)
|
20
|
+
+ new_string = re.sub('[^a-zA-Z\n]', ' ',new_string) # 通常のハイフンに修正
|
21
|
+
```
|
22
|
+
|
23
|
+
以下は、修正前の行をコメントアウトして、上記の、通常のハイフンに修正した行に置き換えたサンプルです。
|
24
|
+
|
25
|
+
- **動作確認用 Repl.it:** [https://repl.it/@jun68ykt/Q297047](https://repl.it/@jun68ykt/Q297047)
|