質問編集履歴
7
変更
title
CHANGED
File without changes
|
body
CHANGED
@@ -22,6 +22,7 @@
|
|
22
22
|
[2 0 8 1 5]
|
23
23
|
[9 9 5 7 4]]
|
24
24
|
つまり、画像の縦x横の大きさの配列に、ピクセルごとの明るさを格納すればいいわけです。>
|
25
|
+
|
25
26
|
また同様のものを載せた[Qiitaのページ](http://qiita.com/tommyfms2/items/c3fa0cb258c17468cb30)もあります
|
26
27
|
「特徴」とは画像ベクトルに格納されている数値(おそらくピクセルごとの明るさ)のことです。
|
27
28
|
このように白黒画像などをピクセルごとに行列に格納するやり方はどのようにすればできるのでしょうか?
|
6
変更
title
CHANGED
File without changes
|
body
CHANGED
@@ -22,6 +22,6 @@
|
|
22
22
|
[2 0 8 1 5]
|
23
23
|
[9 9 5 7 4]]
|
24
24
|
つまり、画像の縦x横の大きさの配列に、ピクセルごとの明るさを格納すればいいわけです。>
|
25
|
-
|
25
|
+
また同様のものを載せた[Qiitaのページ](http://qiita.com/tommyfms2/items/c3fa0cb258c17468cb30)もあります
|
26
26
|
「特徴」とは画像ベクトルに格納されている数値(おそらくピクセルごとの明るさ)のことです。
|
27
27
|
このように白黒画像などをピクセルごとに行列に格納するやり方はどのようにすればできるのでしょうか?
|
5
追記質問
title
CHANGED
File without changes
|
body
CHANGED
@@ -4,6 +4,7 @@
|
|
4
4
|
質問2:またmnistのように画像を1次元に変換するにはどうしたいいのでしょうか?
|
5
5
|
|
6
6
|
追記
|
7
|
+
---
|
7
8
|
下記はcifar10のdataですが、3072列のベクトルとして、各ピクセルに値が載っています。
|
8
9
|
```
|
9
10
|
unpickle("data_batch_1")['data'][0]
|
@@ -22,4 +23,5 @@
|
|
22
23
|
[9 9 5 7 4]]
|
23
24
|
つまり、画像の縦x横の大きさの配列に、ピクセルごとの明るさを格納すればいいわけです。>
|
24
25
|
|
26
|
+
「特徴」とは画像ベクトルに格納されている数値(おそらくピクセルごとの明るさ)のことです。
|
25
27
|
このように白黒画像などをピクセルごとに行列に格納するやり方はどのようにすればできるのでしょうか?
|
4
追記
title
CHANGED
File without changes
|
body
CHANGED
@@ -1,4 +1,25 @@
|
|
1
1
|
googleから公開されているtensorflowのmnistデータセットやcifar10などの画像データはピクセルから構成されています(mnistなら28×28の784行列)。
|
2
2
|
質問1:詳細を見てみると画像データの各ピクセルごとに特徴のある値がありますが、googleはどのようにピクセルから値を出しているのでしょうか?
|
3
3
|
|
4
|
-
質問2:またmnistのように画像を1次元に変換するにはどうしたいいのでしょうか?
|
4
|
+
質問2:またmnistのように画像を1次元に変換するにはどうしたいいのでしょうか?
|
5
|
+
|
6
|
+
追記
|
7
|
+
下記はcifar10のdataですが、3072列のベクトルとして、各ピクセルに値が載っています。
|
8
|
+
```
|
9
|
+
unpickle("data_batch_1")['data'][0]
|
10
|
+
>>array([ 59, 43, 50, ..., 140, 84, 72], dtype=uint8)
|
11
|
+
|
12
|
+
len(unpickle("data_batch_1")['data'][0])
|
13
|
+
>>3072
|
14
|
+
```
|
15
|
+
おそらくピクセルの輝度値を数値化しているのだと思われるのですが、[Qiita](http://qiita.com/IshitaTakeshi/items/4607d9f729babd273960)でも同じような記述が出てきます
|
16
|
+
|
17
|
+
> 例えば、5x5の大きさの白黒の画像はこんな感じで表わせます。
|
18
|
+
[[0 3 3 8 6]
|
19
|
+
[5 7 8 0 1]
|
20
|
+
[1 8 7 1 4]
|
21
|
+
[2 0 8 1 5]
|
22
|
+
[9 9 5 7 4]]
|
23
|
+
つまり、画像の縦x横の大きさの配列に、ピクセルごとの明るさを格納すればいいわけです。>
|
24
|
+
|
25
|
+
このように白黒画像などをピクセルごとに行列に格納するやり方はどのようにすればできるのでしょうか?
|
3
修正
title
CHANGED
@@ -1,1 +1,1 @@
|
|
1
|
-
|
1
|
+
どのようにしてmnistデータやcifar10のピクセルには値が付いているのか
|
body
CHANGED
@@ -1,13 +1,4 @@
|
|
1
|
-
|
1
|
+
googleから公開されているtensorflowのmnistデータセットやcifar10などの画像データはピクセルから構成されています(mnistなら28×28の784行列)。
|
2
|
-
|
2
|
+
質問1:詳細を見てみると画像データの各ピクセルごとに特徴のある値がありますが、googleはどのようにピクセルから値を出しているのでしょうか?
|
3
3
|
|
4
|
-
【質問】
|
5
|
-
mnist
|
4
|
+
質問2:またmnistのように画像を1次元に変換するにはどうしたいいのでしょうか?
|
6
|
-
自然言語処理などは単語をベクトル表記に変換してから学習させますが、CNNでよく行うtensorflowの画像認識の画像のベクトル化は以下のようなコード処理でいいのでしょうか?
|
7
|
-
```
|
8
|
-
img = tf.placeholder(tf.float32, shape=(None))
|
9
|
-
digit = scipy.ndimage.imread("画像.jpg")
|
10
|
-
feed_dict = {img:digit}
|
11
|
-
sess.run(model, feed_dict=feed_dict)
|
12
|
-
|
13
|
-
```
|
2
修正
title
CHANGED
@@ -1,1 +1,1 @@
|
|
1
|
-
一般的な画像
|
1
|
+
CNNの一般的な画像処理のコードについて
|
body
CHANGED
@@ -1,13 +1,13 @@
|
|
1
1
|
【目的】
|
2
|
-
一般の画像から、
|
2
|
+
一般の画像から、MniSTのような784次元の画像ベクトルを作ること。
|
3
3
|
|
4
4
|
【質問】
|
5
|
-
mnistはあらかじめ、784次元の画像ベクトルとラベルから構成されてます。
|
5
|
+
mnistはあらかじめ、784次元の画像ベクトルとラベルから構成されてます。
|
6
|
-
|
6
|
+
自然言語処理などは単語をベクトル表記に変換してから学習させますが、CNNでよく行うtensorflowの画像認識の画像のベクトル化は以下のようなコード処理でいいのでしょうか?
|
7
|
+
```
|
8
|
+
img = tf.placeholder(tf.float32, shape=(None))
|
7
|
-
|
9
|
+
digit = scipy.ndimage.imread("画像.jpg")
|
8
|
-
|
10
|
+
feed_dict = {img:digit}
|
9
|
-
みたいなビットが立つはずです。)
|
10
|
-
|
11
|
+
sess.run(model, feed_dict=feed_dict)
|
11
12
|
|
12
|
-
|
13
|
+
```
|
13
|
-
RGBやグレースケールを使う方法はあるのでしょうか?
|
1
title
CHANGED
File without changes
|
body
CHANGED
@@ -7,4 +7,7 @@
|
|
7
7
|
(例えば10次元の画像なら
|
8
8
|
[0.0.1.0.1.0.0.0.1.0.]
|
9
9
|
みたいなビットが立つはずです。)
|
10
|
-
人間の手で画像にビットを立てることはできないので何かやり方があったら教えて下さい。
|
10
|
+
人間の手で画像にビットを立てることはできないので何かやり方があったら教えて下さい。
|
11
|
+
|
12
|
+
追記
|
13
|
+
RGBやグレースケールを使う方法はあるのでしょうか?
|