回答率: 85.35%

質問するログイン新規登録

質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう！

新規登録して質問してみよう

ただいま回答率: 85.35%

トップ Mecabに関する質問

Q&A

0回答

1028閲覧

Pythonでmecabを使用してexcelファイルの名詞の数を数えたい

総合スコア1

0グッド

0クリップ

投稿2021/07/16 14:08

0

0

pythonでmecabを使用してexcelファイルの名詞の数を数えたいです。

現在のコードは下記の通りです。
エクセルシートの１～1000行に書かれている文章を読み込んでリストを作りたいのですが、出力結果を見るとが1行目のみ読み込まれいるようです。

python
1
2import MeCab
3import pandas as pd
4import sys
5import collections
6
7m=MeCab.Tagger()
8
9df = pd.read_excel('kadai1_text.xlsx',sheet_name='Sheet3',dtype={0:str})
10df = df.dropna()
11
12noun_list = [] # 重複を含めた名詞のリスト
13for i in df:
14    for l in m.parse (i).splitlines():
15        if l != 'EOS' and l.split('\t')[1].split(',')[0] == '名詞': # EOSを除き名詞のみ抽出
16            noun_list.append(l.split('\t')[0]) # 見出し追加
17
18noun_cnt = collections.Counter(noun_list) # 各名詞の数え上げ
19
20for word, cnt in noun_cnt.items():
21    print(word, cnt)
22

以下出力結果

利用 1

以前 1
具合 1
ため 1
購入 1

どなたかご教授いただければと思います。
よろしくお願いいたします。

2021/07/17 01:04

pandasタグの方が適切な気がします。（mecabの処理の有無が関係しますか?）

2021/07/18 23:43

df = df.dropna() の直後に print(df) を入れると何が表示されますか？

行動規範の内容に同意します

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

まだ回答がついていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

関連した質問

トップ Mecabに関する質問

Pythonでmecabを使用してexcelファイルの名詞の数を数えたい

関連した質問

同じタグがついた質問を見る

運営からのお知らせ

【ジャック広告の配信について】現在、非ログイン状態のユーザー様に対して一部の地域限定でジャック広告を配信しております。詳細につきましてはteratailブログをご確認ください。 https://blog.teratail.com/entry/jack-ad-202412

過去のお知らせを見る