Mecab：エラーの対処方法

回答率: 85.48%

質問するログイン新規登録

質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう！

新規登録して質問してみよう

ただいま回答率: 85.48%

トップ Windows 10に関する質問

Q&A

1回答

1913閲覧

Mecab：エラーの対処方法

総合スコア11

0グッド

0クリップ

投稿2021/02/08 11:59

編集2021/02/08 22:53

0

0

実行したいこと

こちらの記事を参考にして
テキストデータtitle2.csv（1列19000行)に対して
単語の頻出度のカウント、特定の品詞の単語の抽出、辞書リストを取り出し降順に並び替え、そしてcsvファイルとして出力をしたいです。
実行するとエラーが出てしまいました。

初心者すぎてどのように修正したらいいかわかりません。どうかお力添え願います。

エラー内容

TypeError                                 Traceback (most recent call last)
<ipython-input-29-f5f0d62ae92a> in <module>
     18 mecab = MeCab.Tagger()
     19 mecab.parse('')
---> 20 node = mecab.parseToNode(text)
     21 
     22 while node:

TypeError: in method 'Tagger_parseToNode', argument 2 of type 'char const *'

該当コード

python
1import MeCab
2import csv
3
4wordFreq_dic = {}
5wordcount_output = []
6text = ""
7
8#解析テキスト
9with open("title2.csv", "r", newline='' , encoding = "utf-8") as rf:
10     readaer = csv.reader(rf)
11
12#単語頻出度カウント
13def WordFrequencyCount(word):
14        if word in wordFreq_dic:
15            wordFreq_dic[word] +=1
16
17        else:
18            wordFreq_dic.setdefault(word, 1)
19        return wordFreq_dic
20
21#特定の品詞の単語を抽出
22mecab = MeCab.Tagger()
23mecab.parse('')
24node = mecab.parseToNode(text)
25
26while node:
27    if node.feature.split(",")[0] == "名詞":
28        word = node.surface
29        WordFrequencyCount(word)
30    elif node.feature.split(",")[0] =="動詞":
31        word = node.surface
32        WordFrequencyCount(word)
33    elif node.feature.split(",")[0] == "形容詞":
34        word = node.surface
35        WordFrequencyCount(word)
36    elif node.feature.split(",")[0] == "形容動詞":
37        word = node.surface
38        WordFrequencyCount(word)
39    else:pass
40    node = node.next
41
42#辞書リストを取り出し、降順に並び替え
43for item in wordFreq_dic.items():
44    wordcount_output.append(item)
45wordcount_output = sorted(wordcount_output, key = lambda x:x[1], reverse=True)
46
47#CSV出力
48with open("wordcount_dic.csv", "w", encoding="utf-8") as f:
49    writer = csv.writer(f, lineterminator="\n")
50    writer.writerows(wordcount_output)

2021/02/08 14:00 編集

これがコードのすべてですか？import文がないようですが…またmecab.parseToNode()に渡すtextを抽出する部分も見当たらないようですが…単に質問を書き込む際の転記漏れなら修正してください

2021/02/08 19:47

import文など文章訂正しましたので、確認お願い致します。

2021/02/08 22:43

「テキストデータinput.csv（1列19000行)に対して」と書かれていますが、コード中にinput.csvが出てきません

2021/02/08 22:51

申し訳ありません。title2.csvの間違いでした。

2021/02/09 05:16 編集

text = "" の後に何もしてないので、textの中身はからっぽなのに、 mecab.parseToNode(text) をやってます readaer = csv.reader(rf) でcsvファイルを読んだデータから、何かしてtextの中身を作るのではないのでしょうか？

行動規範の内容に同意します

回答1件

0

下記の情報によると、ソースコードの入ったファイルがUTF-8で保存されていない場合に同じエラーメッセージが出ています。

[Python] [1] タスク指向型の天気情報案内対話システム (状態遷移ベースの環境準備：MeCab, SCXML)

保存するときの文字コードをUTF-8にしてみてください。

投稿2021/02/08 15:30

総合スコア24666

2021/02/08 19:57

input.csvとwordcount_dic.csvともにUTF-8で保存してはいるのですが、どこか不備はございますでしょうか？

2021/02/08 22:54

input.csv →　title2.csv

2021/02/08 23:22

title2.csvとwordcount_dic.csvはこのプログラムが使うデータですね。そうではなくて、 import MeCab import csv wordFreq_dic = {} が入っているファイルは、UTF-8で保存してしますか？

2021/02/09 00:45

このファイル自体であるinput.ipynbのことですね。確認方法があまりわからないのですが、メモ帳でこのファイルを開くとUTF-8で保存されていました。

行動規範の内容に同意します

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

関連した質問

トップ Windows 10に関する質問

Mecab：エラーの対処方法

関連した質問

同じタグがついた質問を見る

運営からのお知らせ

【サポート業務のお知らせ】ゴールデンウィーク休業につき下記の日程で、お問い合わせ等のサポート業務をお休みいたします。 2024/04/27(土)~2024/04/29(月) 2024/05/03(金)〜2024/05/06(月) なお期間中もサポートへのお問い合わせは受け付けております。

【重要なお知らせ】いつもteratailをご利用いただきありがとうございます。現在、認証システムの修正により、一部のユーザーが強制的にログアウトされる可能性がございます。お手数おかけしますが、再度ログインを行なっていただきますよう宜しくお願いいたします。ご不便をおかけし申し訳ございません。

過去のお知らせを見る