回答編集履歴
1
誤字修正
answer
CHANGED
@@ -1,7 +1,7 @@
|
|
1
1
|
`\b`に頼るのは無理そうなので、単純に「直後に空白文字がある、空白文字以外のもの」という条件にしてみました。要件を満たせそうでしょうか。
|
2
2
|
|
3
3
|
```python
|
4
|
-
vectorizer = CountVectorizer(analyzer="word",token_pattern="(?u)\S+(?=
|
4
|
+
vectorizer = CountVectorizer(analyzer="word",token_pattern="(?u)\S+(?=\s)",lowercase=False,ngram_range=(2,2))
|
5
5
|
```
|
6
6
|
|
7
7
|
手元の環境での実行結果:
|