質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

自然言語処理

自然言語処理は、日常的に使用される自然言語をコンピューターに処理させる技術やソフトウェアの総称です。

Q&A

解決済

2回答

10169閲覧

KeyError: '' が発生している場所がわからない

TarouKotani

総合スコア42

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

自然言語処理

自然言語処理は、日常的に使用される自然言語をコンピューターに処理させる技術やソフトウェアの総称です。

0グッド

0クリップ

投稿2017/12/11 01:35

下記エラーのKeyError: '' が発生している場所がわかりません。
辞書をどこで使っているかがはっきり特定する方法などがわかればと思います。

C:\Users\bluec>python bayes_test.py
2
Traceback (most recent call last):
File "bayes_test.py", line 21, in <module>
pre, scorelist = bf.predict("部品の交換を行いました")
File "C:\Users\bluec\bayes.py", line 60, in predict
score = self.score(words, category)
File "C:\Users\bluec\bayes.py", line 50, in score
score += math.log(self.word_prob(word, category))
File "C:\Users\bluec\bayes.py", line 82, in word_prob
n = self.get_word_count(word, category) + 1 # ---(*6a)
File "C:\Users\bluec\bayes.py", line 69, in get_word_count
if word in self.word_dict[category]:
KeyError: ''

python

1**bayes_test.py** 2 3from bayes import BayesianFilter 4import csv 5 6bf = BayesianFilter() 7# テキストを学習 8data = [] 9with open('format.csv', 'r', encoding='utf-8') as fp: 10 lines = csv.reader(fp) 11 for line in lines: 12 data.append(line) 13print(len(line)) 14bf.fit(line[0],line[1]) 15# 予測 16pre, scorelist = bf.predict("部品の交換を行いました") 17print("結果=", pre) 18print(scorelist) 19 20**bayes.py** 21 22import math, sys 23from janome.tokenizer import Tokenizer # 形態素解析用 24 25class BayesianFilter: 26 """ ベイジアンフィルタ """ 27 def __init__(self): 28 self.words = set() # 出現した単語を全て記録 29 self.word_dict = {} # カテゴリごとの単語出現回数を記録 30 self.category_dict = {} # カテゴリの出現回数を記録 31 32 # 形態素解析を行う --- (※1) 33 def split(self, text): 34 result = [] 35 t = Tokenizer() 36 malist = t.tokenize(text) 37 for w in malist: 38 sf = w.surface # 区切られた単語そのまま 39 bf = w.base_form # 単語の基本形 40 if bf == '' or bf == "*": bf = sf 41 result.append(bf) 42 return result 43 44 # 単語とカテゴリを数える処理 --- (※2) 45 def inc_word(self, word, category): 46 # 単語をカテゴリに追加 47 if not category in self.word_dict: 48 self.word_dict[category] = {} 49 if not word in self.word_dict[category]: 50 self.word_dict[category][word] = 0 51 self.word_dict[category][word] += 1 52 self.words.add(word) 53 def inc_category(self, category): 54 # カテゴリを加算する 55 if not category in self.category_dict: 56 self.category_dict[category] = 0 57 self.category_dict[category] += 1 58 59 # テキストを学習する --- (※3) 60 def fit(self, text, category): 61 """ テキストの学習 """ 62 word_list = self.split(text) 63 for word in word_list: 64 self.inc_word(word, category) 65 self.inc_category(category) 66 67 # カテゴリにおける単語リストのスコアを計算する --- (※4) 68 def score(self, words, category): 69 score = math.log(self.category_prob(category)) 70 for word in words: 71 score += math.log(self.word_prob(word, category)) 72 return score 73 74 # テキストのカテゴリ分けを行う --- (※5) 75 def predict(self, text): 76 best_category = None 77 max_score = -sys.maxsize 78 words = self.split(text) 79 score_list = [] 80 for category in self.category_dict.keys(): 81 score = self.score(words, category) 82 score_list.append((category, score)) 83 if score > max_score: 84 max_score = score 85 best_category = category 86 return best_category, score_list 87 88 # カテゴリ内の単語出現数を得る 89 def get_word_count(self, word, category): 90 if word in self.word_dict[category]: 91 return self.word_dict[category][word] 92 else: 93 return 0 94 95 # カテゴリ/総カテゴリを計算 96 def category_prob(self, category): 97 sum_categories = sum(self.category_dict.values()) 98 category_v = self.category_dict[category] 99 return category_v / sum_categories 100 101 # カテゴリ内の単語の出現率を計算 --- (※6) 102 def word_prob(self, word, category): 103 n = self.get_word_count(word, category) + 1 # ---(*6a) 104 d = sum(self.word_dict[category].values()) + len(self.words) 105 return n / d 106

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

エラーが発生している場所は、メッセージより以下です。

Python

1# カテゴリ内の単語出現数を得る 2 def get_word_count(self, word, category): 3 if word in self.word_dict[category]: # ここ

category = ''であり、キー値(空文字)に対応する値word_dict['']が存在しないのでKeyErrorになっています。

以下のような単純化したコードで考えると理解しやすいかと思います。

Python

1word_dict = {'cat1':{'word1':1}} 2def get_word_count(word, category): 3 words = word_dict[category] # キーに対応する値が存在しなければKeyErrorが発生 4 if word in words: 5 print('OK') 6 7get_word_count('word1', 'cat1') # OK 8get_word_count('word1', '') # KeyError: ''

投稿2017/12/11 02:40

編集2017/12/11 02:44
can110

総合スコア38266

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

ベストアンサー

エラーを回避したいのであれば、
can110さんのコードから引き継いで、
python辞書の.get()メソッドのデフォルト値を与えればよいです。

python

1words = word_dict.get(category, [])

python

1word_dict = {'cat1':{'word1':1}} 2def get_word_count(word, category): 3 words = word_dict.get(category,[]) 4 if word in words: 5 print('OK') 6 else: 7 print('NG') 8 9get_word_count('word1', 'cat1') # OK 10get_word_count('word1', '') # NG

ついでに、word_dict = {'cat1':{'word1':1}}と対応するように、デフォルトはリストではなく辞書を与える方がロジックが正しいです。

python

1words = word_dict.get(category, {})

投稿2017/12/11 05:19

編集2017/12/11 09:00
mkgrei

総合スコア8560

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

TarouKotani

2017/12/11 08:41

can110さん,megrei3からいただきました通り修正すると,下記の通りのエラーになりました。 下記の通りに定義しておりますと、また別な修正が必要でしょうか。 Traceback (most recent call last): File "bayes.py", line 4, in <module> class BayesianFilter: File "bayes.py", line 74, in BayesianFilter get_word_count('word1', 'cat1') # OK File "bayes.py", line 70, in get_word_count words = word_dict.get(category,[]) # キーに対応する値が存在しなけ ればKeyErrorが発生 NameError: name 'word_dict' is not defined #word_dictを定義してるところ def __init__(self): self.words = set() # 出現した単語を全て記録 self.word_dict = {} # カテゴリごとの単語出現回数を記録 self.category_dict = {} # カテゴリの出現回数を記録 | | | | # カテゴリ内の単語出現数を得る word_dict = {'cat1':{'word1':1}} def get_word_count(word, category): words = word_dict.get(category,[]) # キーに対応する値が存在しなければKeyErrorが発生 if word in words: print('OK') get_word_count('word1', 'cat1') # OK get_word_count('word1', '') # KeyError: ''
mkgrei

2017/12/11 08:57

ご自身のコードに沿うように変更されていますか? def get_word_count(word, category) ではなく def get_word_count(self, word, category) words = word_dict.get(category, []) ではなく words = self.word_dict.get(category, [])
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問