質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Keras

Kerasは、TheanoやTensorFlow/CNTK対応のラッパーライブラリです。DeepLearningの数学的部分を短いコードでネットワークとして表現することが可能。DeepLearningの最新手法を迅速に試すことができます。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

566閲覧

CNN 映像で画像認識

huton

総合スコア30

Keras

Kerasは、TheanoやTensorFlow/CNTK対応のラッパーライブラリです。DeepLearningの数学的部分を短いコードでネットワークとして表現することが可能。DeepLearningの最新手法を迅速に試すことができます。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2020/06/25 08:02

質問内容

手話の単語を認識するCNNを自作したのですが、これを用いてリアルタイムのカメラの映像に学習した手話の単語が出てきたときにそれを認識するようなものを作りたいと考えています。これを実装する方法や読むといい本などがあれば教えてもらいたいです。
ソースコード

自作したCNNのソースコードです。
テストデータで確認してみたところ正解率は93%でした。

python

1import keras 2import pickle 3import pandas as pd 4import numpy as np 5import seaborn as sns 6from keras import models 7from keras import layers 8from keras import optimizers 9from pandas import Series,DataFrame 10from keras.utils import to_categorical 11from keras.optimizers import RMSprop 12from keras.preprocessing.image import ImageDataGenerator 13from sklearn.preprocessing import LabelBinarizer 14 15#csv読み込み 16sign_train = pd.read_csv("sign_mnist_train.csv",sep=",") 17lb=LabelBinarizer() 18 19#特訓データ 20train_data=sign_train.drop(['label'],axis=1) 21train_data = train_data.values.reshape(-1,28,28,1) 22train_data=train_data.astype('float32')/255 23train_label=sign_train['label'] 24train_label=lb.fit_transform(train_label) 25 26#モデル 27model=models.Sequential() 28model.add(layers.Conv2D(32,(3,3),activation='relu',input_shape=(28,28,1))) 29model.add(layers.MaxPooling2D((2,2))) 30model.add(layers.Conv2D(64,(3,3),activation='relu')) 31model.add(layers.MaxPooling2D((2,2))) 32model.add(layers.Conv2D(64,(3,3),activation='relu')) 33model.add(layers.Flatten()) 34model.add(layers.Dense(64,activation='relu')) 35model.add(layers.Dropout(0.1)) 36model.add(layers.Dense(64,activation='relu')) 37model.add(layers.Dropout(0.1)) 38model.add(layers.Dense(24,activation='softmax')) 39 40#学習の取り決め 41model.compile(optimizer='adam',loss='categorical_crossentropy',metrics=['acc']) 42 43#学習 44history=model.fit(train_data,train_label,epochs=20,batch_size=200) 45 46#保存 47with open('model.pickle', mode='wb') as f: 48 pickle.dump(model, f)

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

この後、恐らく行うことになるだろう項目を列挙しつつ、検索キーワードを主観で書きます。

  1. カメラから映像を取得する (USB or ネットワークカメラ) キーワード: OpenCV,ラズパイ(ラズパイは情報が多いです)
  2. 映像の中から手話部分だけを取り出し キーワード: Yolo (or Semantic Segmentation?)
  3. 識別(上記のmodel.pickleを読み込んでmodel.predict())
  4. 識別の高速化 キーワード: TensorRT, ONNX, JetsonNano, GStreamer

まずはOpenCVでカメラ映像を取り込むところからスタートだと思います。

投稿2020/06/27 02:46

yymmt

総合スコア1615

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問