質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Tesseract

Tesseractは、Googleが提供しているオープンソースのOCRエンジンです。機械学習があり60以上の言語に対応でき、日本語の文字認識も可能です。さらに精度を上げることもできます。

Q&A

0回答

370閲覧

画像の背景色を白色に変換したい。背景色は中間色です。

firstlast

総合スコア138

Tesseract

Tesseractは、Googleが提供しているオープンソースのOCRエンジンです。機械学習があり60以上の言語に対応でき、日本語の文字認識も可能です。さらに精度を上げることもできます。

0グッド

0クリップ

投稿2019/05/16 03:17

編集2019/05/16 04:25

前提・実現したいこと

Tesseract 4.0(OCRソフト)を使って、パソコンの画面に表示されている文字を認識するプログラムを書いているのですが、文字認識の精度がよくありません。扱っている画像は

認識精度が悪いパターン 

な感じのものです。文字の部分と背景の部分の色の明るさに差があまりなく精度が落ちているのではないかと思っています。因みに、以下のような画像ですと、精度は良かったです。

認識精度がよい例

背景の色を白にできれば精度があがるのではと考えていますが、可能でしょうか?
中間色なので、いろんな色が混ざっていて、色を変換するにも一筋縄でいかないような気がします。
何か良い方法はないものでしょうか?ヒントになるようなことでも、アドバイスでも構いません。よろしくお願いします。

よろしくお願いします。

該当のソースコード

ここまでに画面の画像をbmpに代入しています。 ImageFactory factory = new ImageFactory(); factory.Load(bmp); //factory = factory.Quality(70); factory = factory.Filter(MatrixFilters.GreyScale); factory = factory.Filter(MatrixFilters.BlackWhite); //factory = factory.Filter(MatrixFilters.Comic); //factory = factory.Filter(MatrixFilters.Gotham); factory = factory.Filter(MatrixFilters.HiSatch); //factory = factory.Filter(MatrixFilters.Invert); //factory = factory.Filter(MatrixFilters.Lomograph); //factory = factory.Filter(MatrixFilters.LoSatch); //factory = factory.Filter(MatrixFilters.Polaroid); //factory = factory.Filter(MatrixFilters.Sepia); //factory = factory.Filter(MatrixFilters.Invert); //factory = factory.Format(new PngFormat()); //factory = factory.DetectEdges(new Laplacian3X3EdgeFilter(), true); bmp = new Bitmap(factory.Image); このあと、bmpをファイルに保存しています。 ※ImageFactoryは、画像処理ライブラリImageProcessor.2.7.0.100のクラスです。

試したこと

上記ソースにあるように、画像処理ライブラリImageProcessor.2.7.0.100を使って、グレイスケール化、白黒化、等を試しました。
また、Tesseractの学習機能を使って学習精度を上げる方法も検討しましたが、やり方が難しく実現できていません。

環境

Microsoft Windows 10 Pro (Version 1809)
Microsoft Visual Studio Community 2017(Version 15.9.11)
Microsoft .NET Framework(Version 4.7.03190)
ImageProcessor.2.7.0.100

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだ回答がついていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問