質問編集履歴

6

質問内容の具体化

2021/01/07 08:23

投稿

rest
rest

スコア18

test CHANGED
@@ -1 +1 @@
1
- グレースケール画像を出力したい
1
+ io.imshowによって表示された画像を閉じたい
test CHANGED
@@ -1,15 +1,5 @@
1
- カラー画像を「RGB平均」を使って8bitグレースケール画像にしたいです。
1
+ io.imshowによって表示された画像を閉じたいです。
2
2
 
3
- この画像の持つ情報はRGB, RGBAではなく、輝度値だけにたいです。
3
+ MatplotLibにおるplt.close()相当するような関数を知りたいです。
4
4
 
5
- つまり、shapeが256×256×3でなく、256×256×1になるということです。
6
-
7
-
8
-
9
- または、RGBの1つの要素値のみ取り出して、グレースケール画像を作りたいです。
10
-
11
- これについても同様に、shapeが256×256×3でなく、256×256×1になるようにしたいです。
12
-
13
-
14
-
15
- と、これを可能にする方法がわかず悩んでいます。有識者の方、教えてください。
5
+ ている方はおいっしゃいませんか?

5

質問内容の具体化

2021/01/07 08:23

投稿

rest
rest

スコア18

test CHANGED
File without changes
test CHANGED
@@ -4,4 +4,12 @@
4
4
 
5
5
  つまり、shapeが256×256×3でなく、256×256×1になるということです。
6
6
 
7
+
8
+
9
+ または、RGBの1つの要素値のみ取り出して、グレースケール画像を作りたいです。
10
+
11
+ これについても同様に、shapeが256×256×3でなく、256×256×1になるようにしたいです。
12
+
13
+
14
+
7
15
  ずっと、これを可能にする方法がわからず悩んでいます。有識者の方、教えてください。

4

質問内容の具体化

2021/01/07 07:00

投稿

rest
rest

スコア18

test CHANGED
File without changes
test CHANGED
@@ -1,15 +1,7 @@
1
- librosaを使ってグレースケールのスペクトログラムを作ろうとす。
1
+ カラー画像「RGB平均」を使って8bitグレースケール画像にす。
2
2
 
3
- しかし、以下プログラムのように、スペクトログラムを画像として出力する際にmatplotlibcolormapから、色を選択しなければならないので、グレースケールで出力することができません。ここでいうグレースケールというの、1次元の画像であるため、shapeが(256,256,3)ではなく、(256,256,1)のような画像のことを言す。
3
+ の画像の持つ情報RGB, RGBAではなく、輝度値だけにしたす。
4
4
 
5
- ```python
5
+ つまり、shapeが256×256×3でなく、256×256×1になるということです。
6
6
 
7
- fig = librosa.display.specshow(sp, sr=256, hop_length=hop_length, cmap=binary)
8
-
9
- ```
10
-
11
- [Python でグレースケール化](https://qiita.com/yoya/items/dba7c40b31f832e9bc2a)のサイトでは、カラー画像をグレースケールの画像に変換する方法は書かれていますが、最初からグレースケール画像として出力する方法が書かれていません。
12
-
13
- カラー画像→グレースケールのプロセスを踏むと、補正によって、元の入力値とは異なる値に変換されてしまうため、最初からグレースケールの状態で出力したいです。
14
-
15
- 最初からグレースケールの画像してスペクトログラム出力する方法がる方がいましたら是非教えて頂きたです
7
+ ずっと、これ可能にする方法がらず悩んでいます。有識者の方、教えてください。

3

質問内容の具体化

2021/01/07 06:44

投稿

rest
rest

スコア18

test CHANGED
File without changes
test CHANGED
@@ -1,6 +1,6 @@
1
- まず、条件として、shape=256×256×1のスペクトログラムを作ろうとしています。
1
+ librosaを使って、グレースケールのスペクトログラムを作ろうとしています。
2
2
 
3
- 現段階ではLibrosaを使って、shape=256×256×3のスペクトログラムの画像を以下のように、出力できています。
3
+ しかし以下のプログラムのように、スペクトログラムを画像として出力する際にmatplotlibのcolormapから、色選択しなければならないのでグレースケールで出力することができません。ここでいうグレースケールというのは、1次元の画像であるため、shapeが(256,256,3)ではなく、(256,256,1)ような画像のこといます。
4
4
 
5
5
  ```python
6
6
 
@@ -8,8 +8,8 @@
8
8
 
9
9
  ```
10
10
 
11
- しかし、求めているのはshape=256×256×1のスペクトログラムの画像です。
12
-
13
11
  [Python でグレースケール化](https://qiita.com/yoya/items/dba7c40b31f832e9bc2a)のサイトでは、カラー画像をグレースケールの画像に変換する方法は書かれていますが、最初からグレースケール画像として出力する方法が書かれていません。
14
12
 
13
+ カラー画像→グレースケールのプロセスを踏むと、補正によって、元の入力値とは異なる値に変換されてしまうため、最初からグレースケールの状態で出力したいです。
14
+
15
- 最初からグレースケールの画像として出力する方法が分かる方がいましたら、是非教えて頂きたいです。
15
+ 最初からグレースケールの画像として、スペクトログラムを出力する方法が分かる方がいましたら、是非教えて頂きたいです。

2

質問内容の具体化

2020/12/19 07:00

投稿

rest
rest

スコア18

test CHANGED
@@ -1 +1 @@
1
- VGG16に画像を読み込ませる際のエラー
1
+ グレースケール画像を出力したい
test CHANGED
@@ -1,21 +1,15 @@
1
+ まず、条件として、shape=256×256×1のスペクトログラムを作ろうとしています。
2
+
1
- 音声をスペクトログラムの画像に変換しkerasのVGG16に入力しようとしています。VGG16には0~255の値を各ブロックに入力したいので、音声をスペクトログラムの画像に変換する際に、カラーマップは「binary_r」を使用しいます。この画像を input_shape=256×256×1 VGG16に入力するとのようなエラーが出ます。なぜでしょうか?
3
+ 現段階ではLibrosaを使shape=256×256×3スペクトログラムの画像を以下のように、力できています。
2
4
 
3
5
  ```python
4
6
 
5
- base_model=VGG16(weights=None,include_top=False,input_tensor=Input(shape=(img_width,img_height,1)))
7
+ fig = librosa.display.specshow(sp, sr=256, hop_length=hop_length, cmap=binary)
6
8
 
7
9
  ```
8
10
 
9
- ```python
11
+ しかし、求めているのはshape=256×256×1のスペクトログラムの画像です。
10
12
 
11
- Error when checking input: expected input_5 to have shape (256, 256, 1) but got array with shape (256, 256, 3)
13
+ [Python でグレースケール化](https://qiita.com/yoya/items/dba7c40b31f832e9bc2a)のサイトでは、カラー画像をグレースケールの画像に変換する方法は書かれていますが、最初からグレースケール画像として出力する方法が書かれていません。
12
14
 
13
- ```
14
-
15
- ※学習済みモデルとして使用したいわけではなくVGG16と同じ構造のCNNを使用したい、weights=Noneで間違いないです。
15
+ 最初からグレースケーの画像として出力する方法が分かる方がいました是非教えて頂きたいです。
16
-
17
-
18
-
19
- おそらく、入力が256×256×1であるのにもかかわらず、カラー画像(256×256×3)が入力されていると認識することで生じるエラーだと思うのですが、これを回避し、濃淡だけ(0~255)だけを入力する方法はありますか?有識者の方がいましたら、是非教えて頂きたいです。
20
-
21
- やっていることとしては、[VGG16を転移学習させて「まどか☆マギカ」のキャラを見分ける](https://qiita.com/God_KonaBanana/items/2cf829172087d2423f58)のinput_shapeを256×256×1に変更して、画像の濃淡のみを入力させようとしています。

1

質問の具体化

2020/11/15 05:16

投稿

rest
rest

スコア18

test CHANGED
File without changes
test CHANGED
@@ -1,6 +1,4 @@
1
1
  音声をスペクトログラムの画像に変換し、kerasのVGG16に入力しようとしています。VGG16には0~255の値を各ブロックに入力したいので、音声をスペクトログラムの画像に変換する際に、カラーマップは「binary_r」を使用しています。この画像を input_shape=256×256×1 のVGG16に入力すると下記のようなエラーが出ます。なぜでしょうか?
2
-
3
-  おそらく、入力が256×256×1であるのにもかかわらず、カラー画像(256×256×3)が入力されていると認識することで生じるエラーだと思うのですが、これを回避し、濃淡だけ(0~255)だけを入力する方法はありますか?有識者の方がいましたら、是非教えて頂きたいです。
4
2
 
5
3
  ```python
6
4
 
@@ -15,3 +13,9 @@
15
13
  ```
16
14
 
17
15
  ※学習済みモデルとして使用したいわけではなく、VGG16と同じ構造のCNNを使用したいので、weights=Noneで間違いないです。
16
+
17
+
18
+
19
+ おそらく、入力が256×256×1であるのにもかかわらず、カラー画像(256×256×3)が入力されていると認識することで生じるエラーだと思うのですが、これを回避し、濃淡だけ(0~255)だけを入力する方法はありますか?有識者の方がいましたら、是非教えて頂きたいです。
20
+
21
+ やっていることとしては、[VGG16を転移学習させて「まどか☆マギカ」のキャラを見分ける](https://qiita.com/God_KonaBanana/items/2cf829172087d2423f58)のinput_shapeを256×256×1に変更して、画像の濃淡のみを入力させようとしています。