前提・実現したいこと
機械学習を行うことができるほど大量のデータはない中で、特徴量を見つけ、
新たに与えられるデータを判別できるプログラムを書こうとしています。
データはセンサ5個から3回送られてくるものが1セットです。
新たに与えられるデータも数値が異なるだけで、同様のデータ行列です。
判別したい条件は4つです。
もしどの条件にも合わない場合は、「判別不可」とすることを考えています。
発生している問題・エラーメッセージ
こういったデータの場合、どのように分析することで各条件の特徴を見つけて、
新たに与えられるデータを判別できるのか方法がわからず困っています。
機械学習ができないというのは、各状況下で300セットしかデータ量がないです。
また、どんなアルゴリスムを適用するべきかわからないため、ご意見やアドバイスをいただきたいです。
該当のソースコード
判別したい条件別に例として2セット掲載しました。
行列の行は送られてくる1回目、2回目、3回目を表し、
列はセンサ1〜5を表しています。
条件1
[[1.190 0.085 0.021 0.031 0.106] [1.211 0.084 0.022 0.006 0.107] [1.222 0.091 0.022 0.009 0.125]]
[[1.186 0.086 0.026 0.0286 0.105] [1.235 0.095 0.023 0.006 0.109] [1.190 0.089 0.026 0.009 0.114 ]]
条件2
[[1.208 0.087 0.021 0.00941 0.096] [0.927 0.086 0.026 0.009 0.113] [1.264 0.103 0.025 0.007 0.102]]
[[0.924 0.088 0.024 0.009 0.106] [1.190 0.093 0.021 0.006 0.111] [1.234 0.094 0.025 0.006 0.117]]
条件3
[[0.902 0.083 0.366 1.847 1.873] [0.908 0.081 0.373 1.865 1.882] [1.151 0.083 0.310 1.852 1.820]]
[[0.923 0.083 0.324 1.873 1.907] [1.251 0.094 0.326 1.823 1.839] [0.997 0.110 0.328 1.854 1.901]]
条件4
[[1.441 0.093 0.026 0.013 0.115] [1.331 0.061 0.0230 0.006 0.120] [1.446 0.123 0.0250 0.006 0.116]]
[[1.326 0.095 0.023 0.007 0.107] [1.329 0.058 0.031 0.006 0.105] [1.442 0.105 0.022 0.007 0.123]]
###考えていること
初歩的ではありますが、パッと見でも条件12と条件3、条件4の3パターンでは
センサ1、3などの値が特徴的なのでそう行った条件でif文で判別するのも手かと考えています。
しかし、もしif文等で判別するとしても、その閾値(例えばifセンサ1の平均値>1.3など)を決めるにあたって、データをどのように分析すればより論理的に判別できるか悩んでいます。
補足情報(FW/ツールのバージョンなど)
Python3.6
jupyter4.2
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
退会済みユーザー
2019/06/08 10:55
2019/06/08 19:11