ア、イ、ウ、エ、オ、カ
の形がプログラムにあらかじめ記憶されていて、
この形状を画像内から探すプログラムを作りたいとします。
で、その下の長方形の画像を解析するプログラムを作ろうとしているとして、
ひとまず、この画像の各ピクセル(正方形1つ分)数値情報(RGB)を全て1つのリストに格納するとします。
その上で、「どのピクセルが同じ仲間なのか」を判断するプログラムも作ったとします。
(例えば、リストの0から8までは仲間(全て赤色だから。アだが、アだとはまだ分からない)、
9から16と18までも、仲間(全て青だから)、19~21と28~30と37~39も、仲間(全て緑))
この次の段階ですが、これら各仲間が、上の画像(ア、イ、ウ、、、)のいずれと等しいのか(または近いのか)を判断させるには、どうすれば良いのでしょうか?
ここでニューラルネットワークを用いたいのですが、まず例えば「ア」の画像だけ取り出したとして、すごく横長になってしまいます、「ウ」だったら縦長、つまり画像によってサイズが異なるのですが、この点は問題ないのでしょうか?
次にイのように、番号上分離(9から16までは連続だが、18は分離している、画像上は、上下に隣接しているが、番号上は分離)している場合は、どのように処理すれば良いのでしょう(イであれば、18は無視しても正確に判別できるかも知れないが、ウ等は、縦に並んでおり、番号上は9ずつ飛び飛びになってしまう。)
画像の認識が目標ですね。大きな画像から、小さな、あからじめある、見つけたい画像を見つけ出す。
集合写真の中から、太郎君の顔を見つけ出す、みたいな。
もしくは、集合写真の中から、男の子の人数を計数する、みたいな。
自分の質問は、ふざけているように見られがちですが、常に真剣です。また少しアルゴリズムを考えてみます。
この「分割部分」についてはNNを使わずに、「白」の位置や数を考えるんでしょうか?
あなたの回答
tips
プレビュー