質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
Keras

Kerasは、TheanoやTensorFlow/CNTK対応のラッパーライブラリです。DeepLearningの数学的部分を短いコードでネットワークとして表現することが可能。DeepLearningの最新手法を迅速に試すことができます。

深層学習

深層学習は、多数のレイヤのニューラルネットワークによる機械学習手法。人工知能研究の一つでディープラーニングとも呼ばれています。コンピューター自体がデータの潜在的な特徴を汲み取り、効率的で的確な判断を実現することができます。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

ネットワーク

ネットワークとは、複数のコンピューター間を接続する技術です。インターネットが最も主流なネットワークの形態で、TCP/IP・HTTP・DNSなどの様々なプロトコルや、ルータやサーバーなどの様々な機器の上に成り立っています。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

692閲覧

CNN 機械学種 画像分類で教えて下さい。

watchdogs

総合スコア54

Keras

Kerasは、TheanoやTensorFlow/CNTK対応のラッパーライブラリです。DeepLearningの数学的部分を短いコードでネットワークとして表現することが可能。DeepLearningの最新手法を迅速に試すことができます。

深層学習

深層学習は、多数のレイヤのニューラルネットワークによる機械学習手法。人工知能研究の一つでディープラーニングとも呼ばれています。コンピューター自体がデータの潜在的な特徴を汲み取り、効率的で的確な判断を実現することができます。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

ネットワーク

ネットワークとは、複数のコンピューター間を接続する技術です。インターネットが最も主流なネットワークの形態で、TCP/IP・HTTP・DNSなどの様々なプロトコルや、ルータやサーバーなどの様々な機器の上に成り立っています。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2021/01/28 10:05

CNNのネットワークを組んで
MNISTを用いて画像認識をしています。

意味がわかっていない部分があり教えて欲しいです。
下記はCNNの画像分類のプログラムになります。
質問は、
・カーネルと呼ばれている特徴を叩き出すフィルターの中は乱数なのでしょうか。
・深さとは何なのか教えてもらえますか。

イメージがつかめていないのですが、

extract image features by convolution and max pooling layers

から
CNNの本格的なネットワークの構成の指示が始まっています。
そこで、
このケースではフィルタとなるカーネルサイズ(フィルター)は5×5のサイズを指定しています。
・このフィルターの中は乱数なのでしょうか。
このフィルターは1マスずつ動けば縦横23回移動するので
28×28で構成されているMNISTの画像データは
24×24のサイズになります。
この24×24のサイズのマトリックスを特徴マップと言われている。
・ここで、特徴マップと深さと言われている20はどの様な関係にあるのか
・深さとは一体何なのか理解できません
教えていただけますでしょうか。

Python

1import os 2import keras 3from keras.models import Sequential 4from keras.layers.convolutional import Conv2D 5from keras.layers.convolutional import MaxPooling2D 6from keras.layers.core import Activation 7from keras.layers.core import Flatten 8from keras.layers.core import Dense 9from keras.datasets import mnist 10from keras.optimizers import Adam 11from keras.callbacks import TensorBoard 12 13 14def lenet(input_shape, num_classes): 15 model = Sequential() 16 17 # extract image features by convolution and max pooling layers 18 model.add(Conv2D( 19 20, kernel_size=5, padding="same", 20 input_shape=input_shape, activation="relu" 21 )) 22 model.add(MaxPooling2D(pool_size=(2, 2))) 23 model.add(Conv2D(50, kernel_size=5, padding="same", activation="relu")) 24 model.add(MaxPooling2D(pool_size=(2, 2))) 25 # classify the class by fully-connected layers 26 model.add(Flatten()) 27 model.add(Dense(500, activation="relu")) 28 model.add(Dense(num_classes)) 29 model.add(Activation("softmax")) 30 return model 31 32 33class MNISTDataset(): 34 35 def __init__(self): 36 self.image_shape = (28, 28, 1) # image is 28x28x1 (grayscale) 37 self.num_classes = 10 38 39 def get_batch(self): 40 (x_train, y_train), (x_test, y_test) = mnist.load_data() 41 42 x_train, x_test = [self.preprocess(d) for d in [x_train, x_test]] 43 y_train, y_test = [self.preprocess(d, label_data=True) for d in 44 [y_train, y_test]] 45 46 return x_train, y_train, x_test, y_test 47 48 def preprocess(self, data, label_data=False): 49 if label_data: 50 # convert class vectors to binary class matrices 51 data = keras.utils.to_categorical(data, self.num_classes) 52 else: 53 data = data.astype("float32") 54 data /= 255 # convert the value to 0~1 scale 55 shape = (data.shape[0],) + self.image_shape # add dataset length 56 data = data.reshape(shape) 57 58 return data 59 60 61class Trainer(): 62 63 def __init__(self, model, loss, optimizer): 64 self._target = model 65 self._target.compile( 66 loss=loss, optimizer=optimizer, metrics=["accuracy"] 67 ) 68 self.verbose = 1 69 logdir = "logdir_lenet" 70 self.log_dir = os.path.join(os.path.dirname(__file__), logdir) 71 72 def train(self, x_train, y_train, batch_size, epochs, validation_split): 73 if os.path.exists(self.log_dir): 74 import shutil 75 shutil.rmtree(self.log_dir) # remove previous execution 76 os.mkdir(self.log_dir) 77 78 self._target.fit( 79 x_train, y_train, 80 batch_size=batch_size, epochs=epochs, 81 validation_split=validation_split, 82 callbacks=[TensorBoard(log_dir=self.log_dir)], 83 verbose=self.verbose 84 ) 85 86 87dataset = MNISTDataset() 88 89# make model 90model = lenet(dataset.image_shape, dataset.num_classes) 91 92# train the model 93x_train, y_train, x_test, y_test = dataset.get_batch() 94trainer = Trainer(model, loss="categorical_crossentropy", optimizer=Adam()) 95trainer.train( 96 x_train, y_train, batch_size=128, epochs=12, validation_split=0.2 97 ) 98 99# show result 100score = model.evaluate(x_test, y_test, verbose=0) 101print("Test loss:", score[0]) 102print("Test accuracy:", score[1]) 103

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

・このフィルターの中は乱数なのでしょうか。

初期値は基本的に乱数です。フィルターの中身を更新していくことが学習に相当します。

・深さとは一体何なのか理解できません

深さ(チャネル数と呼ぶことが多い)が20であれば、カーネル(フィルタ)が20個存在します。

元の画像にそれぞれのカーネルを掛け合わせることで、20枚の画像が出来上がります。
つまり、24×24×20のテンソルが得られます。
これを繰り返していきます。

以下の記事がイメージはつかみやすいと思います。
Convolutional Neural Networkとは何なのか - Qiita

投稿2021/01/28 10:18

編集2021/01/28 10:19
Amakaze

総合スコア313

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

watchdogs

2021/01/28 10:46

早速の返答ありがとうございます! わかりました ありがとうございます。 フィルターの中身を更新(学習)と言うのは 全結合(DENSE)の場合と違ってCNNでは カーネルが移動されるたびに更新されるのでしょうか。 それと深さですが、 イメージ的にボカしたバージョンやシャープにしたりとランダムで 画像が加工されるイメージで良いでしょうか。
Amakaze

2021/01/28 10:59

一点目の学習の仕方についてですが、損失関数は最終出力まで計算しないと、計算できません。そのため、カーネルを移動させるたびに更新するようなことは理論上できません。そのため、平均をとるような形になります。 深さのイメージはそれであってます。学習を進めるにしたがって、カーネルごとに特徴的な形を抽出したり、色を抽出したり、識別に有用な情報を取り出すようになっていきます。(形や色のように、人間に理解できるものとは限りませんが)
watchdogs

2021/01/28 11:43

ご回答ありがとうございます。 損失関数の出力後でしたら 学習毎に重みが更新され、 フィルターの内部の数値も更新されると言うことなのでしょうか。
Amakaze

2021/01/28 12:15

ようするにフィルタの数値=重みです。
watchdogs

2021/01/28 14:39

通常全結合の場合はバックプロパゲージョンによって 重みが更新されますが、 CNNのフィルターもバックプロパゲージョンのタイミングで更新されるのでしょうか。 すみません。 何度も聞いてしまいまして。 わからないので教えていただけると大変助かります。
Amakaze

2021/01/28 15:11

すいませんが、本来の質問と違う質問を延々と繰り返すのはやめていただけませんか。わからないことは自分で調べて、それでも理解できない点があるのであれば、ちゃんと別の質問として立て直してください。さすがに付き合いきれません。
watchdogs

2021/01/28 23:19

わかりました。申し訳ございません。ただ調べてもよくわからなくて、悪気はございませんでした。ありがとうございました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問