画像(主に写真)から日本語検出できるgemなどがありましたら、教えていただきたいです。
写真から文字を検出し、文字データとして出力させたいです。
一応webサービスとして公開する予定です。
よろしくお願いします。
気になる質問をクリップする
クリップした質問は、後からいつでもMYページで確認できます。
またクリップした質問に回答があった際、通知やメールを受け取ることができます。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
回答2件
0
OCR ですか...。詳しくはないのですが、ライブラリに与える画像の前処理とかが大変そうな気がします
すこし探してみたところ、tesseract-ocr というのがあるみたいですね。
Ruby ではそのラッパーライブラリがあるようです。
機械学習に対応していて、日本語含む 様々な言語に対応できるようです。
プリセットの学習データでは精度が足りない、といった場合でも あとから別のデータを与えて精度を上げることも出来る、とのこと。
Links
- tesseract-ocr - An OCR Engine that was developed at HP Labs between 1985 and 1995... and now at Google. - Google Project Hosting
- meh/ruby-tesseract-ocr - GitHub
- Tesseract ocr - SlideShare
- オープンソースのOCRエンジン Tesseract-OCR - はだしの元さん
- tesseract-ocr を使ったサンプルです。http://kingyo-bachi.blogspot.jp/2014/01/rubyocr.html にある画像を読み込ませてみることを前提にした内容にしています。
(画像処理に関わる分野は高い専門性が求められている気がします。ライブラリを扱うよりは やはり、有償・無償問わずWeb サービスのAPI を探してみるのがよさそうですね。)
投稿2014/10/01 15:32
総合スコア2321
0
個人的もに興味があったので、ざざっと探してみました。
まともに日本語OCRやってくれそうなWebサービスとしては、docomoのこれでしょうか。
ホーム > API/ツール > 文字認識 | docomo Developer support | NTTドコモ
ただし
サービス提供条件
本APIを利用したサービス提供には以下の制限がございます。予めご了承ください。
・本APIを利用して開発したアプリケーションは無償提供すること。
・本APIを利用して開発したアプリケーションは個人利用に限定すること。
なのでwebサービスとしての利用はムリですね。
フリーの OCR ライブラリとして
tesseract-ocr - An OCR Engine that was developed at HP Labs between 1985 and 1995... and now at Google. - Google Project Hosting
というのがありますね。
オープンソースのOCRエンジン Tesseract-OCR - はだしの元さん
によると日本語対応しているようです。いちおう gem もありました。
meh/ruby-tesseract-ocr
この gem の日本語記事もいちおうありました。
コチョナナバ: rubyでOCR
とはいえ…精度はさほど高くないでしょうね。
こんなところで。
Webサービス公開、ぜひ頑張ってください☆
投稿2014/10/01 15:17
総合スコア241
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
あなたの回答
tips
太字
斜体
打ち消し線
見出し
引用テキストの挿入
コードの挿入
リンクの挿入
リストの挿入
番号リストの挿入
表の挿入
水平線の挿入
プレビュー
質問の解決につながる回答をしましょう。 サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。 また、読む側のことを考えた、分かりやすい文章を心がけましょう。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2014/10/07 09:23
2014/10/07 09:24