回答編集履歴
2
追記
test
CHANGED
@@ -3,3 +3,19 @@
|
|
3
3
|
|
4
4
|
|
5
5
|
たとえばmecabにそのまま通せば半角スペースは無視されますので、それで品詞タグの情報を取り出して名詞だけ抜き出す、というコードを書けば良いのではないでしょうか(mecabのpythonバインディングでやるのも、コマンドラインでやって他ファイルに吐いておいてpythonに読ませるのも、どちらも可能だと思います)。
|
6
|
+
|
7
|
+
|
8
|
+
|
9
|
+
---
|
10
|
+
|
11
|
+
|
12
|
+
|
13
|
+
上のような認識で回答してから「青空文庫から取ってきたそのままのテキストファイルがあるので、名詞のみ分かち書きのフォーマットで出力したい」という要件の可能性があるなぁ、と思いました。
|
14
|
+
|
15
|
+
|
16
|
+
|
17
|
+
だとすれば、こういう感じでやればいいのでは?
|
18
|
+
|
19
|
+
|
20
|
+
|
21
|
+
[【Python】MeCabを使って文章を解析して名詞だけ取得する方法 - あずみ.net](https://a-zumi.net/python-ma-parse-noun/)
|
1
追記
test
CHANGED
@@ -1,4 +1,4 @@
|
|
1
|
-
分かち書きだけだと「名詞だけ取り出す」のは無理です。もう一度、形態素解析器を使う必要があるでしょう。
|
1
|
+
データが単に分かち書きされているだけだと「名詞だけ取り出す」のは無理です。もう一度、形態素解析器を使う必要があるでしょう。
|
2
2
|
|
3
3
|
|
4
4
|
|