pythonでmecabを使用してexcelファイルの名詞の数を数えたいです。
現在のコードは下記の通りです。
エクセルシートの1~1000行に書かれている文章を読み込んでリストを作りたいのですが、出力結果を見るとが1行目のみ読み込まれいるようです。
python
1 2import MeCab 3import pandas as pd 4import sys 5import collections 6 7m=MeCab.Tagger() 8 9df = pd.read_excel('kadai1_text.xlsx',sheet_name='Sheet3',dtype={0:str}) 10df = df.dropna() 11 12noun_list = [] # 重複を含めた名詞のリスト 13for i in df: 14 for l in m.parse (i).splitlines(): 15 if l != 'EOS' and l.split('\t')[1].split(',')[0] == '名詞': # EOSを除き名詞のみ抽出 16 noun_list.append(l.split('\t')[0]) # 見出し追加 17 18noun_cnt = collections.Counter(noun_list) # 各名詞の数え上げ 19 20for word, cnt in noun_cnt.items(): 21 print(word, cnt) 22
以下出力結果
利用 1
以前 1
具合 1
ため 1
購入 1
どなたかご教授いただければと思います。
よろしくお願いいたします。
あなたの回答
tips
プレビュー