質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
86.02%
Tesseract

Tesseractは、Googleが提供しているオープンソースのOCRエンジンです。機械学習があり60以上の言語に対応でき、日本語の文字認識も可能です。さらに精度を上げることもできます。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

受付中

PyOCR: pyocr.get_available_tools()のリストが空

K-Sakurai404
K-404

総合スコア1

Tesseract

Tesseractは、Googleが提供しているオープンソースのOCRエンジンです。機械学習があり60以上の言語に対応でき、日本語の文字認識も可能です。さらに精度を上げることもできます。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

1回答

0グッド

0クリップ

758閲覧

投稿2022/01/26 16:41

PyOCRで文字認識をしようと思っています。

Python

1pyocr.get_available_tools()

を実行してもリストが空のままです。
原因は何が考えられますか?
回答をお願いします。

MacでJupyter Labを使用しています。
参考のため、以下、入力実行したコードです

Python

1!pip install pyocr 2!pip install tesseract 3 4from PIL import Image #あとで使う 5import pyocr 6import pyocr.builders 7import cv2 #あとで使う

一応、terminalにて以下も実行しました

terminal

1brew install tesseract
>tesseract --list-langs List of available languages in "/opt/homebrew/share/tessdata/" (3): eng osd snum

よろしくおねがいします。

気になる質問をクリップする

クリップした質問は、後からいつでもマイページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

下記のような質問は推奨されていません。

  • 質問になっていない投稿
  • スパムや攻撃的な表現を用いた投稿

適切な質問に修正を依頼しましょう。

回答1

0

pip install tesseractで何がインストールされるかを調べてみると、

tesseract 0.1.3に書かれているのは、

The TesseRACt package is designed to compute concentrations of simulated dark matter halos from volume info for particles generated using Voronoi tesselation. This technique is advantageous as it is non-parametric, does not assume spherical symmetry, and allows for the presence of substructure. For a more complete description of this technique including a comparison to other techniques for calculating concentration, please see the accompanying paper Lang et al. (2015).

Google翻訳すると、

TesseRACtパッケージは、ボロノイテッセレーションを使用して生成された粒子の体積情報からシミュレートされた暗黒物質ハローの濃度を計算するように設計されています。 この手法は、ノンパラメトリックであり、球対称性を想定せず、下部構造の存在を可能にするため、有利です。 濃度を計算するための他の手法との比較を含む、この手法のより完全な説明については、添付の論文Lang etal。を参照してください。 (2015)。

です。これはOCRとは関係ないモジュールですね。

brew install tesseractを行った後、パスを設定して日本語追加する必要がありますが、それはやっていますか。
MacでTesseract OCRを使って画像内のテキストを取り出してみるを見てやっておきましょう。

ターミナルでtesseract単体の実行確認をしてから、もう一度Pythonでやってみてください。

投稿2022/01/27 01:13

ppaul

総合スコア24635

下記のような回答は推奨されていません。

  • 質問の回答になっていない投稿
  • スパムや攻撃的な表現を用いた投稿

このような回答には修正を依頼しましょう。

回答へのコメント

K-Sakurai404

2022/01/27 13:26

日本語文字の画像(image.png)を使って以下を実行したら出来ました。ありがとうございます。 >tesseract image.png - -l jpg ちなみにJupyterLabではどうやりますか? pyocr.get_available_tools()のリストがまだ空です

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
86.02%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問

同じタグがついた質問を見る

Tesseract

Tesseractは、Googleが提供しているオープンソースのOCRエンジンです。機械学習があり60以上の言語に対応でき、日本語の文字認識も可能です。さらに精度を上げることもできます。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。