teratail header banner
teratail header banner
質問するログイン新規登録

質問編集履歴

3

再加筆

2021/05/14 00:42

投稿

Pablito
Pablito

スコア71

title CHANGED
File without changes
body CHANGED
@@ -146,4 +146,39 @@
146
146
  continue
147
147
  ^
148
148
  SyntaxError: 'continue' not properly in loop
149
- ```
149
+ ```
150
+
151
+ ###再追記
152
+ 以下のコードに書き換えたところ、
153
+ 出力が全て”EOS”になってしまいました。。
154
+
155
+ ```Python
156
+ import MeCab
157
+ import re
158
+ tagger = MeCab.Tagger()
159
+
160
+
161
+ def mec(text):
162
+ parse = tagger.parse('')
163
+ lines = parse.split('\n')
164
+ words = []
165
+ for line in lines:
166
+ items = re.split('[\t,]',line)
167
+ if len(items) >= 2 and items[1] == '助詞':
168
+ continue
169
+ words.append(items[0])
170
+ return ' '.join(words)
171
+
172
+ df['words'] = df['VOICE'].apply(mec)
173
+ df.head()
174
+
175
+ ###出力
176
+ VOICE words
177
+ 0 字が綺麗になりたいから EOS
178
+ 1 始めたきっかけは親の影響です。 EOS
179
+ 2 字がきれいになりたいから EOS
180
+ 3 字が綺麗な友人に憧れて。 EOS
181
+ 4 文字を綺麗に書きたいと思ったので習い始めました。 EOS
182
+ ```
183
+
184
+ EOSがどこから出てきたのか分からず。。

2

追加のトライを追記しました。

2021/05/14 00:42

投稿

Pablito
Pablito

スコア71

title CHANGED
File without changes
body CHANGED
@@ -116,4 +116,34 @@
116
116
  参考ページ:https://teratail.com/questions/171703
117
117
 
118
118
  ご協力頂けますと大変助かります。
119
- 何卒宜しくお願い致します。
119
+ 何卒宜しくお願い致します。
120
+
121
+ ###追記
122
+ **やりたいことは一行一行の文字列から助詞を抜きたいことです。**
123
+ parseが文字列しか渡せないということで、関数を作ればいいのではと思い、
124
+ 下記のようなコードを作ろうとしたのですが、
125
+ 上手くいきませんでした。。
126
+
127
+ ```Python
128
+ import MeCab
129
+ import re
130
+ def mec(text):
131
+ tagger = MeCab.Tagger()
132
+ parse = tagger.parse('')
133
+ word_class = []
134
+ for line in lines:
135
+ items = re.split('[\t,]',line)
136
+ if len(items) >= 2 and items[1] == '助詞':
137
+ continue
138
+ words.append(items[0])
139
+
140
+ df['words'] = df['VOICE'].apply(mec)
141
+ df.head()
142
+ ```
143
+ エラーメッセージ
144
+ ```
145
+ File "<ipython-input-13-a3ff3e372fa2>", line 10
146
+ continue
147
+ ^
148
+ SyntaxError: 'continue' not properly in loop
149
+ ```

1

追記

2021/05/13 09:36

投稿

Pablito
Pablito

スコア71

title CHANGED
File without changes
body CHANGED
@@ -37,7 +37,7 @@
37
37
  df = pd.read_csv(path, sep=',', encoding='cp932')
38
38
  df.head()
39
39
 
40
- ***
40
+ ***→これの助詞を消したい。
41
41
  VOICE
42
42
  0 字が綺麗になりたいから
43
43
  1 始めたきっかけは親の影響です。