質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
Tesseract

Tesseractは、Googleが提供しているオープンソースのOCRエンジンです。機械学習があり60以上の言語に対応でき、日本語の文字認識も可能です。さらに精度を上げることもできます。

Q&A

0回答

818閲覧

tesseractの考え方

saunawaterpool1

総合スコア4

Tesseract

Tesseractは、Googleが提供しているオープンソースのOCRエンジンです。機械学習があり60以上の言語に対応でき、日本語の文字認識も可能です。さらに精度を上げることもできます。

0グッド

0クリップ

投稿2021/09/23 00:18

スキャンされたPDFの文字(日本語と英語の複合)を読み取りたいのですが、数字は読み込みますが、日本語がと見込めない事が多いです。
印刷物は手書きではなく、ちゃんとした文書ですがうまく読み込めません。
下記のURLにあるようにダウンロードしました。
https://www.kkaneko.jp/tools/win/tesseract5.html
jpn.traineddataをダウンロードしないといけないのでしょうか?
全くの初心者で質問字体わかりにくくて申し訳ないですが、どなたかご回答お願いします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだ回答がついていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問