質問編集履歴

ソースコードの修正

2018/02/01 06:23

投稿

スコア15

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -1,8 +1,11 @@
+LDAを実行したいのですが
-LDAを実行したいのですが、cannot compute lda over an empty collection (no terms)とエラーが表示されます。何が原因か教えてください。
+以下のエラーが表示されます。何が原因か教えてください。
+![イメージ説明](71349b72cc058cb5cf203b2083284642.jpeg)
 やりたいことのイメージとしては、フォルダの各テキストファイルのトピックを知りたいといった感じです。
-ソースコードは以下の通りです。
+ソースコードは以下の通りです(LDA.py)。
+```python
 import os
 import codecs as cd
 import gensim
@@ -21,6 +24,7 @@
 for i, line in enumerate(lines):
     word_vector = []
     if len(line)<30:
         continue
     else:
@@ -30,12 +34,14 @@
         if token.part_of_speech[:2] == '名詞':
             word_vector += [token.base_form]
     wvs += [word_vector]
 dictionary = corpora.Dictionary(wvs)
 dictionary.filter_extremes(no_below=2, no_above=0.3)
 dictionary.save_as_text('dict.txt')
 corpus = [dictionary.doc2bow(text) for text in wvs]
 corpora.MmCorpus.serialize('cop.mm', corpus)
@@ -49,5 +55,6 @@
 for i in range(topic_N):
     print('TOPIC:', i, '__', lda.print_topic(i))
+```
 環境はwindows10,ubuntu16.04です。