tensorflowを利用して文字認識を行いたいのですが、正解ラベルの番号を数値などではなく文字コードで学習させる方法はありますか?
tf.record()では、int型やfloat型、byte型のみ対応しており、文字コードで読み込ませることができない?と思います。
具体的には、1文字の画像のデータをフォルダにまとめ、各画像に文字コード(例、E38181)のラベルをつけます。実際に文章などの文字認識する際には、正解ラベルの文字コード(例、E38181)を文字(例、あ)に変換して認識結果を表示させたいです。
また、pythonでUTF-8の文字コードを文字に変換するにはどうすればよいでしょうか?
文字のデータは、http://etlcdb.db.aist.go.jp/?lang=jaを利用します。
あと、画像の枚数が多い場合にはMEMORRY ERRORが発生するので、上記のデータベースの大量の文字の画像と正解ラベルの文字コードをどのように変換し、自作のニューラルネットワークに入れれば良いのでしょうか?
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。