こちらで質問させていただいた者です.
http://teratail.com/questions/13963
不明点があるので,再度ご質問させていただきます.
以下のようなテキストファイルを読み込み,特定の文字列の出現回数をカウントしたいと考えています.
E 未知語
メール 名詞-サ変接続
は 助詞-係助詞
こちら 名詞-代名詞-一般
まで 助詞-副助詞
: 記号-一般
lang
1from collections import Counter 2f=open('samaple.txt',encoding='utf-8') 3data = f.read() 4counter = Counter(data) 5print(data.count('名詞')) 6>>>3
カウント結果としては,名詞の数は2であってほしいのです.
"代名詞"のように"名詞"を含むものもカウントしてしまうと不都合なのですが,
何かよい方法はないでしょうか.
"名詞-代名詞-一般"
このように名詞という文字列が必ず2回出現するなら,結果を2分の1にすればいいのですが,
"名詞-サ変接続"
こちらのような文字列も存在しているので困っています.
名詞に限らず品詞のカウントを予定しています.
ご教授お願いいたします.

バッドをするには、ログインかつ
こちらの条件を満たす必要があります。