質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Windows 10

Windows 10は、マイクロソフト社がリリースしたOSです。Modern UIを標準画面にした8.1から、10では再びデスクトップ主体に戻され、UIも変更されています。PCやスマホ、タブレットなど様々なデバイスに幅広く対応していることが特徴です。

Tesseract

Tesseractは、Googleが提供しているオープンソースのOCRエンジンです。機械学習があり60以上の言語に対応でき、日本語の文字認識も可能です。さらに精度を上げることもできます。

MSYS

MSYS(Minimal SYStem)は、Windows上で動くUnixシェル、テキスト操作ユーティリティなどをまとめたパッケージ。C言語やFortranのコンパイラであるMinGWをカバーする目的で作られています。

Q&A

解決済

2回答

2795閲覧

MSYS2でtesseractのデータファイルをインストールできない

HearthXml

総合スコア51

Windows 10

Windows 10は、マイクロソフト社がリリースしたOSです。Modern UIを標準画面にした8.1から、10では再びデスクトップ主体に戻され、UIも変更されています。PCやスマホ、タブレットなど様々なデバイスに幅広く対応していることが特徴です。

Tesseract

Tesseractは、Googleが提供しているオープンソースのOCRエンジンです。機械学習があり60以上の言語に対応でき、日本語の文字認識も可能です。さらに精度を上げることもできます。

MSYS

MSYS(Minimal SYStem)は、Windows上で動くUnixシェル、テキスト操作ユーティリティなどをまとめたパッケージ。C言語やFortranのコンパイラであるMinGWをカバーする目的で作られています。

0グッド

0クリップ

投稿2018/01/09 19:48

実現したいこと
ここのOCRの環境を整えたい

やったこと
・MSYS2をダウンロードしてここMSYS2の項目を実行
循環依存が検出されました。と表示されたがたぶんtesseract-OCRはインストールできた
・データファイルをインストールする
pacman -S mingw-w64-tesseract-ocr-osd mingw-w64-{i686,x86_64}-tesseract-ocr-engを実行したが下記のようになった。

a@DESKTOP-K7LTENI MINGW64 ~ $ pacman -S mingw-w64-tesseract-ocr-osd mingw-w64-{i686,x86_64}-tesseract-ocr-eng エラー: 対象が見つかりませんでした: mingw-w64-tesseract-ocr-osd エラー: 対象が見つかりませんでした: mingw-w64-i686-tesseract-ocr-eng エラー: 対象が見つかりませんでした: mingw-w64-x86_64-tesseract-ocr-eng

環境
・win10
・MSYS2 64bit

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

msys2パッケージの リポジトリ を見る限り

  • mingw-w64-x86_64-tesseract-ocr-3..-*-any.pkg.tar.xz
  • mingw-w64-i686-tesseract-ocr-3..-*-any.pkg.tar.xz

は問題なく存在しております。

私の環境ではインストールできます。

一度

Bash

1pacman -Sy

を実行して、パッケージデータベースの同期処理を行った後、再度インストール処理を行ってみてください。

それでも駄目な場合は、上記のパッケージファイルを直接ダウンロードして

Bash

1pacman -U mingw-w64-x86_64[i686]-tesseract-ocr-3.**.**-*-any.pkg.tar.xz

を実行すると良いかと思います。

投稿2018/01/11 01:16

magichan

総合スコア15898

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

HearthXml

2018/01/12 16:12

回答ありがとうございます。 msys2でpacman -Syを実行した後先に進めずもう一人の回答者を参考にしました。
guest

0

ベストアンサー

以下はpython3 環境で PyOCR とtesseract-OCRを使った環境を構築したいという質問に対しての回答です。

1,tesseract-OCRがインストールされているかはデフォルトでは以下のディレクトリにセットアップされるのでパスが存在するかを確認してください。

C:\Program Files (x86)\Tesseract-OCR

2,次にコマンドプロンプトよりtesseract.exeを実行して、パスが通っているかの確認をしてみてください。

3,test.bmpファイルを作成してOCR認識を試してください。(当時は日本語ファイル名だと問題だった記憶があります)
コマンドプロンプトよりtesseract.exe test.bmp out.txt としてみてください。

上記が全部成功したらpythonのスクリプト側でocr処理をしてみてくださいな。

■補足
tesseract- Downloadsから辿れるサードパーティ作成の3.5.1環境があります
tesseract-Win64.zip をダウンロードすると英語のlanguagepack込みです。

投稿2018/01/09 20:06

編集2018/01/09 20:36
umyu

総合スコア5846

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問