OCRを用いたプログラムの開発をしているのですが、その中で特定の文字種に特化した学習素材が必要になりました。
しかし、有効と思われる素材が中々見つからなかったので、自作することにしました。
現状、精度は重視せず、とりあえず使えるものを作るだけ作ろうと考えています。
https://ebi-works.com/ocr-python/
↑こちらのサイトを参考にしようと思っているのですが、
本来は自分で素材を準備して使用するのが良いですが、今回はネット上に公開されている機械学習向けの素材を使用させていただきます。
とのことで、学習素材そのものを作る方法は書かれていません。
また同サイトで提示されているletter.dataについても、画像化および画像のテキスト化の方法が分からず困っています。
letter.dataはどのようなファイルで、どうやって作られたものなのでしょうか?
また、このような学習素材を自作する場合、どのような手順を踏むのが適切でしょうか?
試したこと
「OCR」「学習データ」「作り方」などで検索をかけてみたものの、出てくるのはOCR技術や学習素材の使い方ばかりで、素材の作り方は出てきませんでした。
また、letter.dataをメモ帳やバイナリエディタで開いてみましたが、規則的な書き方はされていたもののそれ以上の手掛かりは得られませんでした。当該ファイルのDL元によると、手書きの文字をラスター化?しているようですが…。
補足情報(FW/ツールのバージョンなど)
開発にはPython 3.11.5を用いていますが、学習素材を作るのに不向きであれば別の環境を使うことも視野に入れています。
回答1件
あなたの回答
tips
プレビュー