回答編集履歴
1
ちょっと書き足し
answer
CHANGED
@@ -4,7 +4,7 @@
|
|
4
4
|
|
5
5
|
ただし、デフォルトのanalyzerが英語用なので、日本語用のanalyzerをanalyzer引数に指定してやる必要があります。これは文字列を受け取って単語のリストを返すような関数にしてやる必要がありますが、幸い`words`関数がそんな機能なので、そのまま使えると思います。
|
6
6
|
|
7
|
-
doc2vec用のTaggedDocumentの生成でも同じ処理をしているので計算が無駄だと思うなら、analyzerには`lambda x:x`のようなものを渡して実質的に機能を殺してやり、
|
7
|
+
doc2vec用のTaggedDocumentの生成でも同じ処理をしているので計算が無駄だと思うなら、analyzerには`lambda x:x`のようなものを渡して実質的に機能を殺してやり、`fit_transform`には
|
8
8
|
|
9
9
|
```python
|
10
10
|
[doc.words for doc in training_docs]
|