質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Tesseract

Tesseractは、Googleが提供しているオープンソースのOCRエンジンです。機械学習があり60以上の言語に対応でき、日本語の文字認識も可能です。さらに精度を上げることもできます。

Q&A

解決済

1回答

2731閲覧

Tesseract-OCRの学習でエラーが発生してしまい困っております。

miyumiyu

総合スコア7

Tesseract

Tesseractは、Googleが提供しているオープンソースのOCRエンジンです。機械学習があり60以上の言語に対応でき、日本語の文字認識も可能です。さらに精度を上げることもできます。

0グッド

0クリップ

投稿2017/11/27 00:24

###前提・実現したいこと
Tesseract-OCRで手書き数字の学習をさせようとしているのですが、以下のエラーメッセージが発生してしまい、うまくいきません。
アドバイスいただけますとありがたいです。

###発生している問題・エラーメッセージ

c:\09TrainingData>combine_tessdata eng.

Combining tessdata files
last_char == '\n':Error:Assert failed:in file ....\ccutil\tessdatamanager.cpp,line 91

###該当のソースコード

###試したこと
Wikiを確認したところ
「最後の文字は、行末マーカー( '\ n')でなければなりません。テキストエディタの中には、ファイルの最後に空の行として表示されるものがあります。これを省略すると、 "last_char == '\ n':Error:Assert failed ...というエラーメッセージが表示されます。」とのことなので、ファイルを開いて確認してみたのですが、該当するものがわからず、困っております。

###補足情報(言語/FW/ツール等のバージョンなど)
環境はwin8.1
Tesseract 3.02
です。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

ファイルは質問者様が編集されたものなのでしょうか。

既にお書きになっている以下の内容そのままの意味になってしまいますが、

「最後の文字は、行末マーカー( '\ n')でなければなりません。テキストエディタの中には、ファイルの最後に空の行として表示されるものがあります。これを省略すると、 "last_char == '\ n':Error:Assert failed ...というエラーメッセージが表示されます。」とのことなので、ファイルを開いて確認してみたのですが、該当するものがわからず、困っております。

改めて該当の以下の内容を読んでみると
Requirements for text input files

ASCII or UTF-8 encoding without BOM
Unix end-of-line marker ('\n')

とあります。BOMがあるとそのBOMを行データと勘違いしてしまうコードはままあるので、お使いのエディターで正しくBOM無しで保存しているか、また、各データの行が正しく\nで改行されているか確認してみてください。

投稿2017/11/27 01:28

dodox86

総合スコア9183

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

miyumiyu

2017/11/27 05:23

ありがとうございます。 無事解決いたしました。 感謝申し上げます。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問