回答編集履歴
3
一度に日本語を直しきれない弱点。
test
CHANGED
@@ -76,7 +76,7 @@
|
|
76
76
|
|
77
77
|
|
78
78
|
|
79
|
-
これがある程度進んでくると、正常品の画像と正常品のクラスタリング結果が出そろってくると思います。ここから入力値に対して正常品かどの異常品か学習できそうな状況になってきそうです。どうやってやるのかは課題になります
|
79
|
+
これがある程度進んでくると、正常品の画像と正常品のクラスタリング結果が出そろってくると思います。ここから入力値に対して正常品かどの異常品か学習できそうな状況になってきそうです。どうやってやるのかは課題になりますし、寄与率も得られないかもしれませんが、信頼度のような指標が代わりに得られるはずです。
|
80
80
|
|
81
81
|
|
82
82
|
|
2
日本語がひどいですね…
test
CHANGED
@@ -6,15 +6,11 @@
|
|
6
6
|
|
7
7
|
|
8
8
|
|
9
|
-
どのようなデータが入力データか十分に想像できませんが、インプットデータはある一定の傾向のまとまりのある
|
9
|
+
どのようなデータが入力データか十分に想像できませんが、インプットデータはある一定の傾向のまとまりのある散布図的なものかと思います。
|
10
10
|
|
11
11
|
|
12
12
|
|
13
|
-
少なくとも、声紋分析に出てくる積層のカラーの図のようなものでも、マイクの周波数特性のようなものでもないと思って回答します。
|
14
|
-
|
15
|
-
|
16
|
-
|
17
|
-
も
|
13
|
+
少なくとも、声紋分析に出てくる積層のカラーの図のようなものでも、マイクの周波数特性のようなものでもない、と思って回答します。例えば、[ここのp.11](https://www.qualisco.com/sites/default/files/fichiers-pdf/ibg_prospekt_eddyvisor_en.pdf)であったならば、と勝手に想像します。
|
18
14
|
|
19
15
|
|
20
16
|
|
@@ -46,7 +42,7 @@
|
|
46
42
|
|
47
43
|
|
48
44
|
|
49
|
-
そのまま上記のステップ1+2+3を一緒にやってしまうと、複雑すぎてうまく特徴をえ
|
45
|
+
そのまま上記のステップ1+2+3を一緒にやってしまうと、複雑すぎてうまく特徴を捉えれなさそうな感じがします。
|
50
46
|
|
51
47
|
そう考えると、最終的にはこれらの数値と画像とマッチングさせないといけませんので、何とかして扱いやすくしたい、ステップ1の段階で次元数を減らしたい(単純化)したいと思うはずです。
|
52
48
|
|
1
日本語の修正(まだ説明が足りないかもしれません)
test
CHANGED
@@ -48,34 +48,40 @@
|
|
48
48
|
|
49
49
|
そのまま上記のステップ1+2+3を一緒にやってしまうと、複雑すぎてうまく特徴をえられなさそうな感じがします。
|
50
50
|
|
51
|
-
そう考えると、最終的にはこれと
|
51
|
+
そう考えると、最終的にはこれらの数値と画像とマッチングさせないといけませんので、何とかして扱いやすくしたい、ステップ1の段階で次元数を減らしたい(単純化)したいと思うはずです。
|
52
52
|
|
53
53
|
|
54
54
|
|
55
|
-
|
55
|
+
ここで必要になるライブラリは、計算は`scipy`や`numpy`、グラフや散布図の可視化は`matplotlib`が役に立つと思います。
|
56
56
|
|
57
57
|
|
58
58
|
|
59
|
-
回帰問題
|
59
|
+
もし、入力データを回帰問題で捉えられるのであれば、傾きと切片が出ますし、母集団があるものであれば重心や標準偏差がステップ2の入力データにできそうですね。
|
60
60
|
|
61
61
|
|
62
62
|
|
63
63
|
**2. 特徴をクラスタリングする**
|
64
64
|
|
65
|
-
クラスタリングは`scikit learn`でやることになると思います。もし、この方法をとらなくても、通常の計算から異常を検出できるのであればそれでも良いと思います。クラスタリングする、というよりも数値上の異常を探すイメージかもしれません。
|
65
|
+
クラスタリングは`scikit learn`でやることになると思います。もし、この方法をとらなくても、通常の計算から異常を検出できるのであればそれでも良いと思います。クラスタリングする、というよりも数値上の異常を探すイメージかもしれません。目的は、ステップ3で異常品と正常品を仕分けるためです。
|
66
66
|
|
67
67
|
|
68
68
|
|
69
69
|
**3. 画像とマッチングする**
|
70
70
|
|
71
|
+
恐らく、解析結果と画像をいきなりマッチングさせるのは困難です。
|
72
|
+
|
73
|
+
画像は上記の入力データ以上に次元が多い(と想定される)ためです。
|
74
|
+
|
71
|
-
|
75
|
+
たとえば512px四方カラー画像であれば、(512*512)^3=1.8e+16(次元)になってしまうので、これらから適切な関係を見つけるのは骨が折れます。
|
72
76
|
|
73
77
|
|
74
78
|
|
75
|
-
そのため、まずはステップ2で見つかった異常が、画像の異常と関係があるか目で見て探します。見つかった異常の画像に異常
|
79
|
+
そのため、少しでもとっつきやすくするために、まずはステップ2で見つかった異常が、画像の異常と関係があるか目で見て探します。見つかった異常の画像に異常という目印をつけます。そうすれば、ちょっと強引かもしれませんが、数値上の異常と画像の異常と関係が見えますね。少なくとも数値的にも見た目的にも異常だ、というものを先に見つけて目印をつけるイメージです。
|
76
80
|
|
77
81
|
|
78
82
|
|
79
|
-
これがある程度進んでくると、正常品の画像と正常品のクラスタリング結果が出そろってくると思います。ここから入力値に対して正常品かどの異常品か学習できそうな状況になってきそうです。
|
83
|
+
これがある程度進んでくると、正常品の画像と正常品のクラスタリング結果が出そろってくると思います。ここから入力値に対して正常品かどの異常品か学習できそうな状況になってきそうです。どうやってやるのかは課題になりますが、寄与率ではありませんが、信頼度のような指標が代わりに得られるはずです。
|
84
|
+
|
85
|
+
|
80
86
|
|
81
87
|
使うライブラリは`Tensorflow`や`chainer`、`Torch`あたりになると思います。
|