質問編集履歴
3
再加筆
title
CHANGED
File without changes
|
body
CHANGED
@@ -146,4 +146,39 @@
|
|
146
146
|
continue
|
147
147
|
^
|
148
148
|
SyntaxError: 'continue' not properly in loop
|
149
|
-
```
|
149
|
+
```
|
150
|
+
|
151
|
+
###再追記
|
152
|
+
以下のコードに書き換えたところ、
|
153
|
+
出力が全て”EOS”になってしまいました。。
|
154
|
+
|
155
|
+
```Python
|
156
|
+
import MeCab
|
157
|
+
import re
|
158
|
+
tagger = MeCab.Tagger()
|
159
|
+
|
160
|
+
|
161
|
+
def mec(text):
|
162
|
+
parse = tagger.parse('')
|
163
|
+
lines = parse.split('\n')
|
164
|
+
words = []
|
165
|
+
for line in lines:
|
166
|
+
items = re.split('[\t,]',line)
|
167
|
+
if len(items) >= 2 and items[1] == '助詞':
|
168
|
+
continue
|
169
|
+
words.append(items[0])
|
170
|
+
return ' '.join(words)
|
171
|
+
|
172
|
+
df['words'] = df['VOICE'].apply(mec)
|
173
|
+
df.head()
|
174
|
+
|
175
|
+
###出力
|
176
|
+
VOICE words
|
177
|
+
0 字が綺麗になりたいから EOS
|
178
|
+
1 始めたきっかけは親の影響です。 EOS
|
179
|
+
2 字がきれいになりたいから EOS
|
180
|
+
3 字が綺麗な友人に憧れて。 EOS
|
181
|
+
4 文字を綺麗に書きたいと思ったので習い始めました。 EOS
|
182
|
+
```
|
183
|
+
|
184
|
+
EOSがどこから出てきたのか分からず。。
|
2
追加のトライを追記しました。
title
CHANGED
File without changes
|
body
CHANGED
@@ -116,4 +116,34 @@
|
|
116
116
|
参考ページ:https://teratail.com/questions/171703
|
117
117
|
|
118
118
|
ご協力頂けますと大変助かります。
|
119
|
-
何卒宜しくお願い致します。
|
119
|
+
何卒宜しくお願い致します。
|
120
|
+
|
121
|
+
###追記
|
122
|
+
**やりたいことは一行一行の文字列から助詞を抜きたいことです。**
|
123
|
+
parseが文字列しか渡せないということで、関数を作ればいいのではと思い、
|
124
|
+
下記のようなコードを作ろうとしたのですが、
|
125
|
+
上手くいきませんでした。。
|
126
|
+
|
127
|
+
```Python
|
128
|
+
import MeCab
|
129
|
+
import re
|
130
|
+
def mec(text):
|
131
|
+
tagger = MeCab.Tagger()
|
132
|
+
parse = tagger.parse('')
|
133
|
+
word_class = []
|
134
|
+
for line in lines:
|
135
|
+
items = re.split('[\t,]',line)
|
136
|
+
if len(items) >= 2 and items[1] == '助詞':
|
137
|
+
continue
|
138
|
+
words.append(items[0])
|
139
|
+
|
140
|
+
df['words'] = df['VOICE'].apply(mec)
|
141
|
+
df.head()
|
142
|
+
```
|
143
|
+
エラーメッセージ
|
144
|
+
```
|
145
|
+
File "<ipython-input-13-a3ff3e372fa2>", line 10
|
146
|
+
continue
|
147
|
+
^
|
148
|
+
SyntaxError: 'continue' not properly in loop
|
149
|
+
```
|
1
追記
title
CHANGED
File without changes
|
body
CHANGED
@@ -37,7 +37,7 @@
|
|
37
37
|
df = pd.read_csv(path, sep=',', encoding='cp932')
|
38
38
|
df.head()
|
39
39
|
|
40
|
-
***
|
40
|
+
***→これの助詞を消したい。
|
41
41
|
VOICE
|
42
42
|
0 字が綺麗になりたいから
|
43
43
|
1 始めたきっかけは親の影響です。
|