質問するログイン新規登録
Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

1回答

631閲覧

Tesseract.exeのパスが通せません

Lena

総合スコア0

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

1グッド

0クリップ

投稿2025/03/31 06:48

1

0

実現したいこと

python初心者です。windows、システム64ビット使っています。
助けてください。

pythonにtesseract OCRをインストールするために、公式GitHubページからダウンロードしましたが、
Add to pathが表示されず、ダウンロードは完了されますが、PCのProgram fileのtesseract OCRフォルダ内に、"tesseract.exe" が表示されません。

正常にインストールされていないのに、バージョンが表示されるのも意味が分かりません。
ちんぷんかんぷんです。ご回答いただけますと幸いです。よろしくお願いいたします。

発生している問題・分からないこと

なぜ、tesseract OCRをダウンロードして、tesseract.exeがダウンロードされないのか。
windows power shellに"pip install tesseract"と入力すると完了しますが、prgram fileにもどこにもtesseract.exeはありません。
"tesseract"というファイルは表示されますが、それをダブルクリックしたら、瞬間的にポップアップが開いてすぐに閉じられます。

該当のソースコード

特になし

試したこと・調べたこと

  • teratailやGoogle等で検索した
  • ソースコードを自分なりに変更した
  • 知人に聞いた
  • その他
上記の詳細・結果

chat GDPから
「環境変数を編集」>システム環境変数>Path>新規で”C:\Program Files\Tesseract-OCR"を追加

実行してプロンプトコマンドに "tesseract -v" を入力
すると、バージョンが表示されたら大丈夫と提案され行ったところ、バージョンが表示されましたが、
PCのProgram fileのtesseract OCRフォルダ内は変化せず。

何度もインストールされたものをアンインストールして完全削除し、再度インストールしても変化ありません。

補足

特になし

melian👍を押しています

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

melian

2025/03/31 07:12

Powershell の場合、Get-Command で指定のコマンドの絶対パスを知ることができます。 例12: メモ帳コマンドのすべてのインスタンスを取得する https://learn.microsoft.com/ja-jp/powershell/module/microsoft.powershell.core/get-command#12 > この例では、 コマンドレットの Get-Command パラメーターを使用して、ローカル コンピューター上の Notepad コマンドのすべてのインスタンスを表示します。 なので、以下を実行して tesseract.exe の絶対パスを確認してみてください。 Get-Command tesseract
Lena

2025/03/31 07:39

melian様 ご回答ありがとうございます。 power shellで調べてみたら下記のように出力されました。存在していないということですよね? Get-Command : 用語 'tesseract' は、コマンドレット、関数、スクリプト ファイル、または操作可能なプログラムの名前として認識されません。名前が正しく記述されていることを確認し、パスが含まれている場合はそのパスが正しいことを確認してから、再試行してください。 発生場所 行:1 文字:1 + Get-Command tesseract -All | Format-Table CommandType, Name, Definiti ... + ~~~~~~~~~~~~~~~~~~~~~~~~~~ + CategoryInfo : ObjectNotFound: (tesseract:String) [Get-Command], CommandNotFoundException + FullyQualifiedErrorId : CommandNotFoundException,Microsoft.PowerShell.Commands.GetCommandCommand ダウンロードは完了しているみたいなんですが、なぜですか?
melian

2025/03/31 07:45

PowerShell のコマンドラインで tesseract -v を実行するとバージョンが表示される、ということなので PATH のどこかに存在するのかと思ったのですが、そうではない様ですね。。。
quickquip

2025/03/31 07:53

> windows power shellに"pip install tesseract"と入力すると完了しますが、prgram fileにもどこにもtesseract.exeはありません。 ここ、質問の本筋とぜんぜん関係ありません。 https://pypi.org/project/tesseract/ は "ボロノイ分割を用いて生成された粒子の体積情報から、シミュレーションされたダークマターハローの濃度を計算する"というパッケージです
Lena

2025/03/31 07:58

melian様 ご返信ありがとうございます。 powershellでtesseract -vを実行して表示されたのに、存在しないと… 途方にくれてしまいますね。 なぜ、Add to pathがインストールする際のポップアップに表示されないのか、甚だ疑問です。 しかしながら、お忙しいところご回答ありがとうございます。
quickquip

2025/03/31 07:59

Power shell で ls 'C:\Program Files\Tesseract-OCR\tesseract.exe' を実行したときの結果はどうなりますか?
quickquip

2025/03/31 08:01

> なぜ、Add to pathがインストールする際のポップアップに表示されないのか、甚だ疑問です。 そのポップアップが出るはずだという根拠はありますか? ちなみに手元でインストールしてみましたがパスへの追加のポップアップは(確かに)出ませんでした
Lena

2025/03/31 08:14

quickquip様 コメントありがとうございます。 まず、power shellでls 'C:\Program Files\Tesseract-OCR\tesseract.exe'と実行したところ検出されませんでした。 また、tesseract OCRを公式からダウンロードするという動画をYoutubeで3本みました。皆さん同じようにポップアップが出現することは確かです。ですが、そのポップアップにpathを通すチェックボックスが表示されている方、表示されていない方がいらっしゃいました。表示されていない方の動画はpathの設定について説明されてなく、やり方が分かりません。その方のコードは実装されていました。
melian

2025/03/31 09:03

> そのポップアップにpathを通すチェックボックスが表示されている方、表示されていない方 Tesseract の Wiki に解説がありました。過去に問題が起こったので最新版では無効化されているとのことです。 History: UB-Mannheim/tesseract Wiki https://github.com/UB-Mannheim/tesseract/wiki#history > Hint: Old versions of the installer had an option to add Tesseract to the PATH environment variable. That option was disabled by default. If it was enabled and PATH was very long, it could happen that the new PATH was empty. We suggest not to use that option and disabled it in our latest version.
TakaiY

2025/03/31 09:06

情報を整理したほうがよさそうですね。「 > 公式GitHubページからダウンロードしましたが、 それはどのページでしょうか。 公式のGitHubのインストール手順 https://github.com/tesseract-ocr/tesseract?tab=readme-ov-file#installing-tesseract にあるリンク先のWindowsの項目にはいくつかのバージョンについて書かれています。 https://tesseract-ocr.github.io/tessdoc/Installation.html どれをダウンロードしましたか? > Add to pathが表示されず、 ダウンロードしたインストーラを実行したのだと思いますが、どのようにインストールが進んだのでしょう。 > ダウンロードするという動画をYoutubeで3本みました。 Webにある情報が古いものだったり違うバージョンのものだったり、最悪は嘘だったりするので、物によって異なることはよくあります。
Lena

2025/03/31 11:51

quickquip様 >ちなみに手元でインストールしてみましたがパスへの追加のポップアップは(確かに)出ませんでした 今はチェックボックスが表示されないんでしょうか?quickquip様がダウンロードされた際に、tesseract.exeも正常にダウンロードされましたか? 私が確認した動画の一部のURLです。 ダウンロード時にチェックボックスが表示されたポップアップが出現した動画は、たくさん動画見過ぎて見つけられませんでした。すみません。確か、その動画は4年前です。ですが、他の動画のURLを載せておきます。 https://www.youtube.com/watch?v=BqyJt1wCN_0&t=154s https://www.youtube.com/watch?v=hhZPCGVigHw 2本目の動画を見ますと分かる通り、tesseract.exeがダウンロードされるタイミングで、私はダウンロードできていません。この時にpathも確認しました。tsseractについてのpathは表示されていませんでした。
Lena

2025/03/31 11:59

Takai Y様 コメントありがとうございます。 https://github.com/UB-Mannheim/tesseract/wiki の Tesseract installer for Windowsにある tesseract-ocr-w64-setup-5.5.0.20241111.exe (64 bit)を ダウンロードしました。 ダウンロードはcomplete、tesseract.exeが表示されてなく、pathを確認しましたが、もちろん関連する表示はありませんでした。chatGTPから、変数の編集欄に新規追加するよう提案があり、追加しpowershellで、tesseract -v を実行したらバージョンが表示されました。どこかにあるはずなので、絶対パスを特定しようとしましたが得られず。 ダウンロードしたものは、おそらく全てアンインストールして完全削除されてます。ゴミ箱にもないです。
Lena

2025/03/31 12:03

melian様 >Tesseract の Wiki に解説がありました。過去に問題が起こったので最新版では無効化されているとのことです。 本当ですか!それを聞いたら少し安心しました。ですが、pathを有効にする術がないですね… ありがとうございます!粘ります!
TakaiY

2025/03/31 12:58

> ダウンロードはcomplete、 これはインストーラですので、これを実行する必要があるのですが、インストールはしたのでしょうか? インストールしたとすると、途中でインストール先のパスが表示されているはずですが、それはどのようになっていますか? 表示されたパスには tessaract.exeはありますか? 動画を見ると、環境変数PATHは手動で設定するようになっています。 動画では、program files配下ですが、実際にそうとは限りません。 上記の手順で確認したものにする必要があります。
melian

2025/03/31 13:14 編集

https://github.com/tesseract-ocr/tesseract/releases/tag/5.5.0 にある、tesseract-ocr-w64-setup-5.5.0.20241111.exe をダウンロードして、Windows10 PC にインストールしてみました。インストーラの最後のステップでは "Add to Path" のチェックボックスは表示されませんでした。 インストール後は C:\Program Files\Tesseract-OCR\tesseract.exe が存在します。また、PATH に C:\Program Files\Tesseract-OCR を追加して Get-Command を実行すると以下の結果になります。 PS C:\Users\hoge> Get-Command tesseract CommandType Name Version Source ----------- ---- ------- ------ Application tesseract.exe 0.0.0.0 C:\Program Files\Tesseract-OCR\tesseract.exe
Lena

2025/04/01 07:49

ご回答ありがとうございます。現在のところの成果としまして、 powershellで PS C:\Users\Owner> Get-Command tesseract CommandType Name Version Source ----------- ---- ------- ------ Application tesseract.exe 0.0.0.0 C:\Program Files\Tesseract-OCR\tessera... たぶんパスは通せたのかなと思っていました。 画像の絶対パスは、"C:\Users\Owner\Desktop\test1.jpg"。 VScodeで、import pytesseract from PIL import Image # Tesseractの実行ファイルの絶対パスを指定 pytesseract.pytesseract.tesseract_cmd = "C:/Program Files/Tesseract-OCR/tesseract.exe" # 画像をOCR(日本語指定) image_path = "C:/Users/Owner/Desktop/test1.jpg" image = Image.open(image_path) #text_OCRを実行 text = pytesseract.image_to_string("test1.jpg", lang="jpn") print(text) 上記のように入力したら、 ターミナルに、 PS C:\Users\Owner\Documents\python> & C:/Users/Owner/AppData/Local/Programs/Python/Python313/python.exe c:/Users/Owner/Documents/python/ocr.py Traceback (most recent call last): File "c:\Users\Owner\Documents\python\ocr.py", line 12, in <module> text = pytesseract.image_to_string("test1.jpg", lang="jpn") File "C:\Users\Owner\AppData\Local\Programs\Python\Python313\Lib\site-packages\pytesseract\pytesseract.py", line 486, in image_to_string return { ~ ...<2 lines>... Output.STRING: lambda: run_and_get_output(*args), ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ }[output_type]() ~~~~~~~~~~~~~~^^ File "C:\Users\Owner\AppData\Local\Programs\Python\Python313\Lib\site-packages\pytesseract\pytesseract.py", line 489, in <lambda> Output.STRING: lambda: run_and_get_output(*args), ~~~~~~~~~~~~~~~~~~^^^^^^^ File "C:\Users\Owner\AppData\Local\Programs\Python\Python313\Lib\site-packages\pytesseract\pytesseract.py", line 352, in run_and_get_output run_tesseract(**kwargs) ~~~~~~~~~~~~~^^^^^^^^^^ File "C:\Users\Owner\AppData\Local\Programs\Python\Python313\Lib\site-packages\pytesseract\pytesseract.py", line 284, in run_tesseract raise TesseractError(proc.returncode, get_errors(error_string)) pytesseract.pytesseract.TesseractError: (1, 'Error, cannot read input file C:\\Users\\Owner\\Documents\\python\\test1.jpg: No such file or directory Error during processing.') エラーと出力されました。 powershellで確認したところ、 PS C:\Users\Owner> tessract tessract : 用語 'tessract' は、コマンドレット、関数、スクリプト ファイル、または操作可能なプログラムの名前として認識されません。名前が正し く記述されていることを確認し、パスが含まれている場合はそのパスが正しいことを確認してから、再試行してください。 発生場所 行:1 文字:1 + tessract + ~~~~~~~~ + CategoryInfo : ObjectNotFound: (tessract:String) [], CommandNotFoundException + FullyQualifiedErrorId : CommandNotFoundException PS C:\Users\Owner> tesseract --version tesseract v5.5.0.20241111 leptonica-1.85.0 libgif 5.2.2 : libjpeg 8d (libjpeg-turbo 3.0.4) : libpng 1.6.44 : libtiff 4.7.0 : zlib 1.3.1 : libwebp 1.4.0 : libopenjp2 2.5.2 Found AVX2 Found AVX Found FMA Found SSE4.1 Found libarchive 3.7.7 zlib/1.3.1 liblzma/5.6.3 bz2lib/1.0.8 liblz4/1.10.0 libzstd/1.5.6 Found libcurl/8.11.0 Schannel zlib/1.3.1 brotli/1.1.0 zstd/1.5.6 libidn2/2.3.7 libpsl/0.21.5 libssh2/1.11.0 バージョンは表示されるけど、パスが通っていないのかな、というところです。 頭整理してきます…
TakaiY

2025/04/01 07:53

ぜんぜん読んでませんが、 > PS C:\Users\Owner> tessract つづり間違えています。
Lena

2025/04/01 12:16

TakaiY様 すみません!いまpowershellで確認したら、 PS C:\Users\Owner> tesseract --version tesseract v5.5.0.20241111 leptonica-1.85.0 libgif 5.2.2 : libjpeg 8d (libjpeg-turbo 3.0.4) : libpng 1.6.44 : libtiff 4.7.0 : zlib 1.3.1 : libwebp 1.4.0 : libopenjp2 2.5.2 Found AVX2 Found AVX Found FMA Found SSE4.1 Found libarchive 3.7.7 zlib/1.3.1 liblzma/5.6.3 bz2lib/1.0.8 liblz4/1.10.0 libzstd/1.5.6 Found libcurl/8.11.0 Schannel zlib/1.3.1 brotli/1.1.0 zstd/1.5.6 libidn2/2.3.7 libpsl/0.21.5 libssh2/1.11.0 パス通っていました!ご指摘ありがとうございます!
Lena

2025/04/01 12:33

tesseract呼び出せました!! PS C:\Users\Owner\Documents\python> & C:/Users/Owner/AppData/Local/Programs/Python/Python313/python.exe c:/Users/Owner/Documents/python/code_1.py OCR結果: 川 全く答えは違いますが….どうにかなりました! 皆様、ご指摘、ご提案ありがとうございました!!
Lena

2025/04/01 12:43

milian様 コメントありがとうございます。milian様の3/31 22:14のコメントを ベストアンサーに選びたいので同じ内容を回答欄に投稿いただけますでしょうか?
guest

回答1

0

https://github.com/tesseract-ocr/tesseract/releases/tag/5.5.0 にある、tesseract-ocr-w64-setup-5.5.0.20241111.exe をダウンロードして、Windows10 PC にインストールしてみました。インストーラの最後のステップでは "Add to Path" のチェックボックスは表示されませんでした。
インストール後は C:\Program Files\Tesseract-OCR\tesseract.exe が存在します。また、PATH に C:\Program Files\Tesseract-OCR を追加して Get-Command を実行すると以下の結果になります。

sh

1PS C:\Users\hoge> Get-Command tesseract 2 3CommandType Name Version Source 4----------- ---- ------- ------ 5Application tesseract.exe 0.0.0.0 C:\Program Files\Tesseract-OCR\tesseract.exe

投稿2025/04/01 13:38

melian

総合スコア21296

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.30%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問