発生している問題・エラーメッセージ
いぬ・うさぎ・ライオン という三種類の単語の手書き文字のデータがそれぞれ100個ずつある。今OCRのアルゴリズムを作り、それぞれの文字画像を読み込ませたところ、正常にいぬorうさぎorライオンと認識される他に、
・いぬ の場合
いね、いむ、( )ぬ・・・などと認識されることがある
・うさぎ の場合
うきぎ、うちぎ、ウさぎ・・・などと認識されることがある
・ライオン の場合
ライオソ、ライ才ソ、ラ人オン・・・などと認識されることがある。
試したこと
いぬのデータセットを150個に増やしてみたが精度があまり変わらなかった。
実現したいこと
今回、データは必ずいぬ・うさぎ・ライオンのどれかなので、1文字でもヒットしていたらその文字と認識するようにしたい。
例えば、
”い”ね・”い”む・( )”ぬ” と認識された →いぬ に変換
”う”きぎ・”う”ちぎ、ウ”さぎ” と認識された →うさぎ に変換 のようにアルゴリズムを書いて変換したい。
例えばライオンの場合なら、アルゴリズム中で、ラorイorオorン の文字がないかを見て間違っていたらその文字を置き換え、というif文を思いついたが、この方法は使えないと思った。
なぜなら、今は認識したい動物の数が3種類だからこの方法も使えなくはないが、この動物の数が100種類になった場合とかに、アルゴリズムの量が多すぎて、システムの動きがものすごく遅くなってしまうからである。
同様の処理をもっと軽量な方法で実装できないかどうかをお聞きしたい。
回答3件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2018/03/26 01:08
2018/03/26 03:21