python Tesseract-OCRが日本語の言語データファイルを開けない

Question

### 実現したいこと
-python Tesseract-OCRが日本語の言語データファイルを開けないので、開けるようにしたい

### 前提

pythonでOCRをつかう機能を実装中に以下のエラーメッセージが出ました

### 発生している問題・エラーメッセージ

```
Traceback (most recent call last):
  File "test_1.py", line 25, in <module>
    result = tool.image_to_string(img_org, lang="jpn", builder=builder)
  File "/home/△△△/.local/lib/python3.8/site-packages/pyocr/tesseract.py", line 372, in image_to_string
    raise TesseractError(status, errors)
pyocr.error.TesseractError: (1, b'Error opening data file C:\Program Files\Tesseract-OCR\tessdata/jpn.traineddata

Please make sure the TESSDATA_PREFIX environment variable is set to your "tessdata" directory.

Failed loading language \'jpn\'
Tesseract couldn\'t load any languages!
Could not initialize tesseract.
')
```

### 該当のソースコード

```python
import os
import sys
from PIL import Image
import pyocr
import pyocr.builders

TESSERACT_PATH = 'C:\Program Files\Tesseract-OCR'
TESSDATA_PATH = 'C:\Program Files\Tesseract-OCR\tessdata'

os.environ["PATH"] += os.pathsep + TESSERACT_PATH
os.environ["TESSDATA_PREFIX"] = TESSDATA_PATH

tools = pyocr.get_available_tools()
if len(tools) == 0:
    print("No OCR tool found")
    sys.exit(1)
tool = tools[0]

# 画像の読み込み
img_org = Image.open("/mnt/c/Users/orcbo/Documents/src/48.jpg")

# OCRの実行
builder = pyocr.builders.TextBuilder()
result = tool.image_to_string(img_org, lang="jpn", builder=builder)

print(result)
```

### 試したこと

・システム環境変数に変数名"TESSDATA_PREFIX"変数値"C:\Program Files\Tesseract-OCR	essdate"を設定したこと
・tesseract 48.png output_48 -l jpnのコマンド成功したこと

### 補足情報
wsl ubuntu 20.04.6 LTSを使用
python 3.8.10
VScodeを使用

Accepted Answer

**※ChatGPTのGPT-4を使って回答をしていますので、スパムではありません。
　スパムと回答された方はその前にこの問題を解決してあげてみてはいかがでしょうか。**

日本語の言語データファイルを開けるようにするには、いくつかのステップが必要です。以下の手順を試してください。

１．まず、tesseractの日本語言語データを確認してください。C:\Program Files\Tesseract-OCR	essdataディレクトリにjpn.traineddataがあることを確認してください。もし存在しない場合、tesseractのリポジトリからダウンロードして、tessdataディレクトリに配置してください。

２．環境変数を正しく設定しているか確認してください。あなたが提供したコードには、Windows向けのパスが含まれていますが、エラーメッセージとその他のファイルパスはLinux環境を示しています。Pythonの実行環境がWindowsである場合、以下のコードを使用してください。
TESSERACT_PATH = r'C:\Program Files\Tesseract-OCR'
TESSDATA_PATH = r'C:\Program Files\Tesseract-OCR	essdata'

os.environ["PATH"] += os.pathsep + TESSERACT_PATH
os.environ["TESSDATA_PREFIX"] = TESSDATA_PATH

もしPythonの実行環境がLinuxである場合、適切なパスを指定する必要があります。
例えば、以下のようになります。
TESSERACT_PATH = '/usr/local/bin'
TESSDATA_PATH = '/usr/local/share/tessdata'

os.environ["PATH"] += os.pathsep + TESSERACT_PATH
os.environ["TESSDATA_PREFIX"] = TESSDATA_PATH

ただし、Linux環境の場合、パスはインストール方法やディストリビューションによって異なる場合があるため、適切なパスを指定してください。

プログラムを再実行し、エラーが解決されたか確認してください。
まだ問題が解決されていない場合は、Python環境を再起動して環境変数の変更が反映されるようにしてください。

これらの手順を試しても問題が解決しない場合は、環境によってはさらに追加の設定が必要な場合があります。
その場合は、状況に応じて追加情報を提供してください。

実現したいこと

前提

発生している問題・エラーメッセージ

該当のソースコード

試したこと

補足情報

関連した質問