質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.47%
Tesseract

Tesseractは、Googleが提供しているオープンソースのOCRエンジンです。機械学習があり60以上の言語に対応でき、日本語の文字認識も可能です。さらに精度を上げることもできます。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

1回答

1133閲覧

PyOCR: pyocr.get_available_tools()のリストが空

K-Sakurai404

総合スコア3

Tesseract

Tesseractは、Googleが提供しているオープンソースのOCRエンジンです。機械学習があり60以上の言語に対応でき、日本語の文字認識も可能です。さらに精度を上げることもできます。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2022/01/26 16:41

PyOCRで文字認識をしようと思っています。

Python

1pyocr.get_available_tools()

を実行してもリストが空のままです。
原因は何が考えられますか?
回答をお願いします。

MacでJupyter Labを使用しています。
参考のため、以下、入力実行したコードです

Python

1!pip install pyocr 2!pip install tesseract 3 4from PIL import Image #あとで使う 5import pyocr 6import pyocr.builders 7import cv2 #あとで使う

一応、terminalにて以下も実行しました

terminal

1brew install tesseract
>tesseract --list-langs List of available languages in "/opt/homebrew/share/tessdata/" (3): eng osd snum

よろしくおねがいします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

pip install tesseractで何がインストールされるかを調べてみると、

tesseract 0.1.3に書かれているのは、

The TesseRACt package is designed to compute concentrations of simulated dark matter halos from volume info for particles generated using Voronoi tesselation. This technique is advantageous as it is non-parametric, does not assume spherical symmetry, and allows for the presence of substructure. For a more complete description of this technique including a comparison to other techniques for calculating concentration, please see the accompanying paper Lang et al. (2015).

Google翻訳すると、

TesseRACtパッケージは、ボロノイテッセレーションを使用して生成された粒子の体積情報からシミュレートされた暗黒物質ハローの濃度を計算するように設計されています。 この手法は、ノンパラメトリックであり、球対称性を想定せず、下部構造の存在を可能にするため、有利です。 濃度を計算するための他の手法との比較を含む、この手法のより完全な説明については、添付の論文Lang etal。を参照してください。 (2015)。

です。これはOCRとは関係ないモジュールですね。

brew install tesseractを行った後、パスを設定して日本語追加する必要がありますが、それはやっていますか。
MacでTesseract OCRを使って画像内のテキストを取り出してみるを見てやっておきましょう。

ターミナルでtesseract単体の実行確認をしてから、もう一度Pythonでやってみてください。

投稿2022/01/27 01:13

ppaul

総合スコア24666

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

K-Sakurai404

2022/01/27 13:26

日本語文字の画像(image.png)を使って以下を実行したら出来ました。ありがとうございます。 >tesseract image.png - -l jpg ちなみにJupyterLabではどうやりますか? pyocr.get_available_tools()のリストがまだ空です
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.47%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問