質問編集履歴
1
完成コード追記
test
CHANGED
File without changes
|
test
CHANGED
@@ -149,3 +149,51 @@
|
|
149
149
|
そこでコードBのように、`lemma_list`からそのような不要な単語を削除してから頻出順にソートしてcsvファイルに出力したいのです。
|
150
150
|
|
151
151
|
よろしくお願いします<(_ _)>
|
152
|
+
|
153
|
+
|
154
|
+
|
155
|
+
# できましたー!
|
156
|
+
|
157
|
+
```python
|
158
|
+
|
159
|
+
# ...
|
160
|
+
|
161
|
+
lemma_list = []
|
162
|
+
|
163
|
+
for text in texts:
|
164
|
+
|
165
|
+
lemma = analyzer.parse(text)[0].normal_form
|
166
|
+
|
167
|
+
lemma_list.append(lemma)
|
168
|
+
|
169
|
+
|
170
|
+
|
171
|
+
lemma_list = list(filter(lambda d: d not in ('и', 'мы', 'она', 'в', 'не',
|
172
|
+
|
173
|
+
'он', 'на', 'быть', 'что',
|
174
|
+
|
175
|
+
'весь', 'с', 'наш', 'это'
|
176
|
+
|
177
|
+
'как', 'они', 'к', 'а',
|
178
|
+
|
179
|
+
'о', 'из', 'но', 'у',
|
180
|
+
|
181
|
+
'за', 'же', 'от', 'я',
|
182
|
+
|
183
|
+
'свой', 'ты', 'то', 'по',
|
184
|
+
|
185
|
+
'до', 'бы', 'вы', 'уже',
|
186
|
+
|
187
|
+
'над', 'без', 'под', 'вот'), lemma_list))
|
188
|
+
|
189
|
+
# ...
|
190
|
+
|
191
|
+
|
192
|
+
|
193
|
+
```
|
194
|
+
|
195
|
+
|
196
|
+
|
197
|
+
**出力結果**
|
198
|
+
|
199
|
+
![出力結果](e329bcd33c5318647d41cfd49ea13e2e.png)
|