*python3.4,windows使用*
メール\tメール\tメール\t名詞\tサ変接続\t\t\n は\tハ\tは\t助詞\t係助詞\t\t\n こちら\tコチラ\tこちら\t名詞\t代名詞\t一般\t\t\n
タブで区切られた4つ目の'名詞','助詞','名詞'を出現頻度をカウントしたいです.
単純にカウントすると以下のように'名詞'が'3'となります.
'代名詞'に含まれる'名詞'はカウントしたくないので,'2'という結果が欲しいのです.
lang
1>>> from collections import Counter 2>>> f=open('hoge.txt',encoding='hoge') 3>>> data = f.read() 4>>> counter = Counter(data) 5>>> print(data.count('名詞')) 63
各要素がタブ区切りになっているのでうまく使えないかとは思うのですが,
自分ではうまくできません.
最終的に,このサンプルなら
名詞 2
助詞 1
という結果を返してほしいのですが,良い方法を教えていただけないでしょうか.
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。