前提・実現したいこと
Char型のtoStringメソッドを使えばChar型に入れた文字コードに該当する
1文字を取得することができます。
UNICODEの未定義文字、制御文字を判別する方法があれば、
それらの処理をスキップすることができますが、どうすればいいでしょうか。
該当のソースコード
C#
Char data; //表示する文字データ
for (int nCode = 0; nCode < Char.MaxValue; nCode++)
{
data.ToString();
}
サロゲートペアはどう考えているのです? ひょっとして、基本面に収まっている文字だけを考えている?
すみません、そこまで深く考えていませんでした。1文字を画像化して比較するためにUNICODE文字を総当たりしようと考えましたが、他の文字コードも検討しようかなと思い始めています。
深く考えての話でなないのなら、とりあえず基本面に収まっている文字だけを対象にして(それ以外は、質問者さんが言う「排除」とする)やってみたらいかがですか?
SHift_JIS とか UTF-8 とかを「他の文字コードも検討」の対象にしようと考えているようですが、それ見当違いだと思いますよ。
質問者さんの PC の OS は Windows だと思いますが、であれば付属の IME パッドを開いて眺めてみることをお勧めします。私の言ってることが多少なりとも理解していただけるのではないかと思います。
文字コードだけではなく、フォントの問題も絡んでいるとなると私の手には負えないのであきらめて別の方法を探そうかと思います。
一度 https://teratail.com/help/question-tips を読んでください。特に「2. 質問をする前に自分で何がわからないのかを把握しましょう」のセクション。そこに書いてあるように、何がわからないかわからない人から質問を受けても、答える側も困ってしまいます。
そうですね。最初は投稿タイトル通りの質問で収めようとしましたが、回答を見ているうちにタイトル以外に発生したわからないことも聞いてしまいました。今後はタイトル以外の質問が発生した場合は一度問題点を整理して別の質問として再投稿することにします。
回答3件
あなたの回答
tips
プレビュー