質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Tesseract

Tesseractは、Googleが提供しているオープンソースのOCRエンジンです。機械学習があり60以上の言語に対応でき、日本語の文字認識も可能です。さらに精度を上げることもできます。

Visual Studio

Microsoft Visual StudioはMicrosoftによる統合開発環境(IDE)です。多種多様なプログラミング言語に対応しています。

OpenCV

OpenCV(オープンソースコンピュータービジョン)は、1999年にインテルが開発・公開したオープンソースのコンピュータビジョン向けのクロスプラットフォームライブラリです。

パス

パス(path)はファイルシステムの場所(階層)を明示したものです。

C++

C++はC言語をもとにしてつくられた最もよく使われるマルチパラダイムプログラミング言語の1つです。オブジェクト指向、ジェネリック、命令型など広く対応しており、多目的に使用されています。

Q&A

1回答

1788閲覧

tesseractをvisual studioで実行するとtext::OCRTesseract::createの言語データのパスが通らない,tesseract not foundと表示される

_research

総合スコア4

Tesseract

Tesseractは、Googleが提供しているオープンソースのOCRエンジンです。機械学習があり60以上の言語に対応でき、日本語の文字認識も可能です。さらに精度を上げることもできます。

Visual Studio

Microsoft Visual StudioはMicrosoftによる統合開発環境(IDE)です。多種多様なプログラミング言語に対応しています。

OpenCV

OpenCV(オープンソースコンピュータービジョン)は、1999年にインテルが開発・公開したオープンソースのコンピュータビジョン向けのクロスプラットフォームライブラリです。

パス

パス(path)はファイルシステムの場所(階層)を明示したものです。

C++

C++はC言語をもとにしてつくられた最もよく使われるマルチパラダイムプログラミング言語の1つです。オブジェクト指向、ジェネリック、命令型など広く対応しており、多目的に使用されています。

0グッド

0クリップ

投稿2020/04/16 06:03

編集2020/04/17 07:24

このサイトvisual studio2017でtesseractとOpenCVを使用できるようにするための記事を参考にビルドし,以下のサンプルコード(opencvで文字認識その1 Tesseractラッパ - …)

c

1void main() 2{ 3 // 画像読み込み 4 auto image = cv::imread("moji.jpg"); 5 // グレースケール化 6 cv::Mat gray; 7 cv::cvtColor(image, gray, COLOR_RGB2GRAY); 8 // 文字認識クラスのインスタンス生成 9 auto ocr = cv::text::OCRTesseract::create("C:\Tesseract-OCR_v_20181030\tessdata","jpn"); 10 11 std::string text; 12 std::vector<cv::Rect> boxes; 13 std::vector<std::string> words; 14 vector<float> confidences; 15 // 文字認識の実行 16 ocr->run(gray, text, &boxes, &words, &confidences); 17 18 // 結果出力 19 printf("%s\n", text.c_str()); 20 // 文字のかたまりごとに出力 21 printf(" 文字 | 位置 | 大きさ | 信頼度\n"); 22 printf("-----------+------------+------------+----------\n"); 23 for (int i = 0; i < boxes.size(); i++) 24 { 25 printf("%-10s | (%3d, %3d) | (%3d, %3d) | %f\n", 26 words[i].c_str(), 27 boxes[i].x, boxes[i].y, 28 boxes[i].width, boxes[i].height, 29 confidences[i]); 30 } 31}

を実行したが,tesseract not foundと表示され結果が出ないです.
これはどのような原因が考えられるのでしょうか.教えていただきたいです.

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

パスがおかしいんじゃないか、という話をするときに"(言語データのパス)/tessdata"なんて丸めてしまうのはいかがなものか、と思いますけれど。

何年か前にC#でtesseractOCRをいじったときには、VisualStudioのデバッグ実行だと「カレントディレクトリはどこだ?」というのを強く意識しないとdataファイルに行き着けなかった記憶があります。プロジェクト直下にdataフォルダを掘ってそこにデータファイルを置く、とかそんな感じにすると良かったんだっけ? もう忘れてますが。

・絶対パスでは通るのか
・相対パスの場合、カレントディレクトリはどこにあるのか
あたりを調べれば解決しそうな気がします。

投稿2020/04/16 22:29

thkana

総合スコア7639

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

_research

2020/04/17 07:33 編集

質問のリンク先とコードを修正しました. tessdataには日本語のtraineddataも入っています. 実際に実行すると次のように表示されます. OCRTesseract(33): Tesseract not found. C:\Tesseract-OCR_v_20181030\tessdata jpn OCRTesseract(00): Tesseract not found. 文字 | 位置 | 大きさ | 信頼度 -----------+------------+------------+----------
_research

2020/04/17 07:33

回答ありがとうございます. dataファイルの位置を変更してみます.
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問