teratail header banner
teratail header banner
質問するログイン新規登録

回答編集履歴

1

追記

2018/01/16 08:32

投稿

KSwordOfHaste
KSwordOfHaste

スコア18404

answer CHANGED
@@ -6,5 +6,9 @@
6
6
 
7
7
  > VGGモデルは、通常入力画像を(batchsize,channels,height,width)、channelsはRGBではなくBGRという形式のnumpyarrayに整形する必要があるが、これはそれらの操作を行ってくれる。また、256x256へリサイズ、224x224へクロップする作業、VGG16の平均画素[103.939, 116.779, 123.68]の引き算も同時に行う。
8
8
 
9
+ なんでもまずはググってみるもんだと思います。
9
10
 
10
- なんでもまずはググってみるもんだと思います。
11
+ 追記:
12
+ ちょっと尻切れ的なので多少補足します。自分は上記の記事で全てがわかったわけではありません。しかし次のことを思い出しました。色の表現方法には何通りもありますね。例えばRGBはハードウェアが色を再現するのに単純で扱いやすい形式ですがその表現は「人間の色彩の特徴にマッチしない」点があるそうです。色空間の表現にはそれぞれ「何かの目的にかなうような特徴」を備えているのだと思います。そういうものとRGBのようなものとの間で変換をする際にはマジックナンバー(なんだかよくわからない定数)による変換が必要になることがあります。BGRとRGBとの変換ではそういう意味合いでの「マジックナンバー」が必要でそれがコードに用いられている定数ということだと思います。
13
+
14
+ 上記のように検索してみるとRGB, BGRという色空間の変換であることがわかりますのでその定数が実際にどういう意味を持つかはBGRを調べればわかるのではないかと思います。自分はそこまで見てませんがより詳しく調べるにはさらに調べると色々わかると思います。