質問編集履歴
2
完成したコード追加
test
CHANGED
File without changes
|
test
CHANGED
@@ -119,3 +119,133 @@
|
|
119
119
|
|
120
120
|
|
121
121
|
```
|
122
|
+
|
123
|
+
|
124
|
+
|
125
|
+
# できましたー(≧∇≦)b
|
126
|
+
|
127
|
+
日本語は`[^\x01-\x7E]`ではなく`[亜-熙ぁ-んァ-ヶ]`でした! [opyon](https://teratail.com/users/opyon)様、ありがとうございます。
|
128
|
+
|
129
|
+
|
130
|
+
|
131
|
+
```
|
132
|
+
|
133
|
+
import csv
|
134
|
+
|
135
|
+
import re # Regular expression
|
136
|
+
|
137
|
+
import pandas as pd
|
138
|
+
|
139
|
+
import warnings
|
140
|
+
|
141
|
+
warnings.filterwarnings('ignore')
|
142
|
+
|
143
|
+
|
144
|
+
|
145
|
+
csv_ori = pd.read_csv('original.csv', sep=",")
|
146
|
+
|
147
|
+
ja_l = []
|
148
|
+
|
149
|
+
for i, index in csv_ori.iterrows():
|
150
|
+
|
151
|
+
print('i: ' + str(i))
|
152
|
+
|
153
|
+
com = csv_ori.iloc[i]["comment"]
|
154
|
+
|
155
|
+
ja = re.sub('[亜-熙ぁ-んァ-ヶ]', 'None', com)
|
156
|
+
|
157
|
+
print(ja)
|
158
|
+
|
159
|
+
ja_l.append(ja)
|
160
|
+
|
161
|
+
|
162
|
+
|
163
|
+
print(ja_l)
|
164
|
+
|
165
|
+
|
166
|
+
|
167
|
+
for index, row in csv_ori.iterrows():
|
168
|
+
|
169
|
+
csv_ori['comment'][index] = ja_l[index]
|
170
|
+
|
171
|
+
|
172
|
+
|
173
|
+
csv_ori.to_csv('original.csv', index=False)
|
174
|
+
|
175
|
+
```
|
176
|
+
|
177
|
+
|
178
|
+
|
179
|
+
**出力結果**
|
180
|
+
|
181
|
+
Terminal
|
182
|
+
|
183
|
+
```
|
184
|
+
|
185
|
+
i: 0
|
186
|
+
|
187
|
+
Hi
|
188
|
+
|
189
|
+
...
|
190
|
+
|
191
|
+
...(略)
|
192
|
+
|
193
|
+
i: 10
|
194
|
+
|
195
|
+
find
|
196
|
+
|
197
|
+
['Hi', 'World', 'Hello', 'NoneNoneNoneNoneNone', 'Python', 'NoneNoneNone', 'NoneNoneNone', 'Sato', 'Flower', 'class', 'find']
|
198
|
+
|
199
|
+
|
200
|
+
|
201
|
+
```
|
202
|
+
|
203
|
+
CSVファイル
|
204
|
+
|
205
|
+
```
|
206
|
+
|
207
|
+
user_id,comment
|
208
|
+
|
209
|
+
1,Hi
|
210
|
+
|
211
|
+
2,World
|
212
|
+
|
213
|
+
3,Hello
|
214
|
+
|
215
|
+
5,NoneNoneNoneNoneNone
|
216
|
+
|
217
|
+
4,Python
|
218
|
+
|
219
|
+
2,NoneNoneNone
|
220
|
+
|
221
|
+
1,NoneNoneNone
|
222
|
+
|
223
|
+
3,Sato
|
224
|
+
|
225
|
+
5,Flower
|
226
|
+
|
227
|
+
4,class
|
228
|
+
|
229
|
+
3,find
|
230
|
+
|
231
|
+
```
|
232
|
+
|
233
|
+
|
234
|
+
|
235
|
+
# 日本語を消したいのはなぜ?
|
236
|
+
|
237
|
+
[tatsu99](https://teratail.com/users/tatsu99)さまの質問より。
|
238
|
+
|
239
|
+
- 現在先生([Christian Mayer](https://www.amazon.co.jp/Christian-Mayer/e/B07GTHYQ1K/ref=dp_byline_cont_ebooks_1))についてもらってPythonを学習
|
240
|
+
|
241
|
+
- Pythonの基礎を学ぶことと並行して、実践演習課題もある。
|
242
|
+
|
243
|
+
- 実践演習課題としてフリーランス案件を選んでコードを書く、というものがある。
|
244
|
+
|
245
|
+
- 私が[Need a Python program to do some data cleaning to a csv file](https://www.freelancer.com/projects/python/Need-Python-program-some-data/?w=f)を選択、そして日本語を抽出する正規表現でコケている。
|
246
|
+
|
247
|
+
- ちなみにcsvファイルは自分でそれっぽく作ってこのファイルを対象にしてコードを書く。
|
248
|
+
|
249
|
+
|
250
|
+
|
251
|
+
実践演習でいつも時間がアイスクリーム並みに溶けていきます^^;
|
1
csv追加
test
CHANGED
File without changes
|
test
CHANGED
@@ -13,6 +13,36 @@
|
|
13
13
|
|
14
14
|
|
15
15
|
よろしくお願いしますorz
|
16
|
+
|
17
|
+
**csv ファイルの中身**
|
18
|
+
|
19
|
+
```
|
20
|
+
|
21
|
+
user_id,comment
|
22
|
+
|
23
|
+
1,Hi
|
24
|
+
|
25
|
+
2,World
|
26
|
+
|
27
|
+
3,Hello
|
28
|
+
|
29
|
+
5,こんにちは
|
30
|
+
|
31
|
+
4,Python
|
32
|
+
|
33
|
+
2,きょう
|
34
|
+
|
35
|
+
1,あゆむ
|
36
|
+
|
37
|
+
3,Sato
|
38
|
+
|
39
|
+
5,Flower
|
40
|
+
|
41
|
+
4,class
|
42
|
+
|
43
|
+
3,find
|
44
|
+
|
45
|
+
```
|
16
46
|
|
17
47
|
|
18
48
|
|