質問編集履歴

2

完成したコード追加

2018/10/14 04:35

投稿

Yukiya025
Yukiya025

スコア86

test CHANGED
File without changes
test CHANGED
@@ -119,3 +119,133 @@
119
119
 
120
120
 
121
121
  ```
122
+
123
+
124
+
125
+ # できましたー(≧∇≦)b
126
+
127
+ 日本語は`[^\x01-\x7E]`ではなく`[亜-熙ぁ-んァ-ヶ]`でした! [opyon](https://teratail.com/users/opyon)様、ありがとうございます。
128
+
129
+
130
+
131
+ ```
132
+
133
+ import csv
134
+
135
+ import re # Regular expression
136
+
137
+ import pandas as pd
138
+
139
+ import warnings
140
+
141
+ warnings.filterwarnings('ignore')
142
+
143
+
144
+
145
+ csv_ori = pd.read_csv('original.csv', sep=",")
146
+
147
+ ja_l = []
148
+
149
+ for i, index in csv_ori.iterrows():
150
+
151
+ print('i: ' + str(i))
152
+
153
+ com = csv_ori.iloc[i]["comment"]
154
+
155
+ ja = re.sub('[亜-熙ぁ-んァ-ヶ]', 'None', com)
156
+
157
+ print(ja)
158
+
159
+ ja_l.append(ja)
160
+
161
+
162
+
163
+ print(ja_l)
164
+
165
+
166
+
167
+ for index, row in csv_ori.iterrows():
168
+
169
+ csv_ori['comment'][index] = ja_l[index]
170
+
171
+
172
+
173
+ csv_ori.to_csv('original.csv', index=False)
174
+
175
+ ```
176
+
177
+
178
+
179
+ **出力結果**
180
+
181
+ Terminal
182
+
183
+ ```
184
+
185
+ i: 0
186
+
187
+ Hi
188
+
189
+ ...
190
+
191
+ ...(略)
192
+
193
+ i: 10
194
+
195
+ find
196
+
197
+ ['Hi', 'World', 'Hello', 'NoneNoneNoneNoneNone', 'Python', 'NoneNoneNone', 'NoneNoneNone', 'Sato', 'Flower', 'class', 'find']
198
+
199
+
200
+
201
+ ```
202
+
203
+ CSVファイル
204
+
205
+ ```
206
+
207
+ user_id,comment
208
+
209
+ 1,Hi
210
+
211
+ 2,World
212
+
213
+ 3,Hello
214
+
215
+ 5,NoneNoneNoneNoneNone
216
+
217
+ 4,Python
218
+
219
+ 2,NoneNoneNone
220
+
221
+ 1,NoneNoneNone
222
+
223
+ 3,Sato
224
+
225
+ 5,Flower
226
+
227
+ 4,class
228
+
229
+ 3,find
230
+
231
+ ```
232
+
233
+
234
+
235
+ # 日本語を消したいのはなぜ?
236
+
237
+ [tatsu99](https://teratail.com/users/tatsu99)さまの質問より。
238
+
239
+ - 現在先生([Christian Mayer](https://www.amazon.co.jp/Christian-Mayer/e/B07GTHYQ1K/ref=dp_byline_cont_ebooks_1))についてもらってPythonを学習
240
+
241
+ - Pythonの基礎を学ぶことと並行して、実践演習課題もある。
242
+
243
+ - 実践演習課題としてフリーランス案件を選んでコードを書く、というものがある。
244
+
245
+ - 私が[Need a Python program to do some data cleaning to a csv file](https://www.freelancer.com/projects/python/Need-Python-program-some-data/?w=f)を選択、そして日本語を抽出する正規表現でコケている。
246
+
247
+ - ちなみにcsvファイルは自分でそれっぽく作ってこのファイルを対象にしてコードを書く。
248
+
249
+
250
+
251
+ 実践演習でいつも時間がアイスクリーム並みに溶けていきます^^;

1

csv追加

2018/10/14 04:35

投稿

Yukiya025
Yukiya025

スコア86

test CHANGED
File without changes
test CHANGED
@@ -13,6 +13,36 @@
13
13
 
14
14
 
15
15
  よろしくお願いしますorz
16
+
17
+ **csv ファイルの中身**
18
+
19
+ ```
20
+
21
+ user_id,comment
22
+
23
+ 1,Hi
24
+
25
+ 2,World
26
+
27
+ 3,Hello
28
+
29
+ 5,こんにちは
30
+
31
+ 4,Python
32
+
33
+ 2,きょう
34
+
35
+ 1,あゆむ
36
+
37
+ 3,Sato
38
+
39
+ 5,Flower
40
+
41
+ 4,class
42
+
43
+ 3,find
44
+
45
+ ```
16
46
 
17
47
 
18
48