編集履歴

回答編集履歴

一度に日本語を直しきれない弱点。

2019/12/07 00:23

投稿

スコア0

test CHANGED Viewed

@@ -76,7 +76,7 @@
-これがある程度進んでくると、正常品の画像と正常品のクラスタリング結果が出そろってくると思います。ここから入力値に対して正常品かどの異常品か学習できそうな状況になってきそうです。どうやってやるのかは課題になりますが、寄与率ではありませんが、信頼度のような指標が代わりに得られるはずです。
+これがある程度進んでくると、正常品の画像と正常品のクラスタリング結果が出そろってくると思います。ここから入力値に対して正常品かどの異常品か学習できそうな状況になってきそうです。どうやってやるのかは課題になりますし、寄与率も得られないかもしれませんが、信頼度のような指標が代わりに得られるはずです。

日本語がひどいですね…

2019/12/07 00:23

投稿

退会済みユーザー

スコア0

test CHANGED Viewed

@@ -6,15 +6,11 @@
-どのようなデータが入力データか十分に想像できませんが、インプットデータはある一定の傾向のまとまりのあるアウトプットかと思います。
+どのようなデータが入力データか十分に想像できませんが、インプットデータはある一定の傾向のまとまりのある散布図的なものかと思います。
-少なくとも、声紋分析に出てくる積層のカラーの図のようなものでも、マイクの周波数特性のようなものでもないと思って回答します。
-もし、得られているデータが[ここのp.11](https://www.qualisco.com/sites/default/files/fichiers-pdf/ibg_prospekt_eddyvisor_en.pdf)にあるようなもの勝手に想像します。
+少なくとも、声紋分析に出てくる積層のカラーの図のようなものでも、マイクの周波数特性のようなものでもない、と思って回答します。例えば、[ここのp.11](https://www.qualisco.com/sites/default/files/fichiers-pdf/ibg_prospekt_eddyvisor_en.pdf)であったならば、と勝手に想像します。
@@ -46,7 +42,7 @@
-そのまま上記のステップ1+2+3を一緒にやってしまうと、複雑すぎてうまく特徴をえられなさそうな感じがします。
+そのまま上記のステップ1+2+3を一緒にやってしまうと、複雑すぎてうまく特徴を捉えれなさそうな感じがします。
 そう考えると、最終的にはこれらの数値と画像とマッチングさせないといけませんので、何とかして扱いやすくしたい、ステップ1の段階で次元数を減らしたい（単純化）したいと思うはずです。

日本語の修正（まだ説明が足りないかもしれません）

2019/12/07 00:21

投稿

退会済みユーザー

スコア0

test CHANGED Viewed

@@ -48,34 +48,40 @@
 そのまま上記のステップ1+2+3を一緒にやってしまうと、複雑すぎてうまく特徴をえられなさそうな感じがします。
-そう考えると、最終的にはこれともう一段先のさらに画像とマッチングさせないといけない都合上、何とかしてステップ1の段階で次元数を減らしたい（単純化）したいと思うはずです。
+そう考えると、最終的にはこれらの数値と画像とマッチングさせないといけませんので、何とかして扱いやすくしたい、ステップ1の段階で次元数を減らしたい（単純化）したいと思うはずです。
-具体的なライブラリは、計算は`scipy`や`numpy`、グラフや散布図の可視化は`matplotlib`が役に立つと思います。
+ここで必要になるライブラリは、計算は`scipy`や`numpy`、グラフや散布図の可視化は`matplotlib`が役に立つと思います。
-回帰問題になるのであれば、傾きと切片が出ますし、母集団があるものであれば重心や標準偏差がステップ2の入力データにできそうですね。
+もし、入力データを回帰問題で捉えられるのであれば、傾きと切片が出ますし、母集団があるものであれば重心や標準偏差がステップ2の入力データにできそうですね。
 **2. 特徴をクラスタリングする**
-クラスタリングは`scikit learn`でやることになると思います。もし、この方法をとらなくても、通常の計算から異常を検出できるのであればそれでも良いと思います。クラスタリングする、というよりも数値上の異常を探すイメージかもしれません。
+クラスタリングは`scikit learn`でやることになると思います。もし、この方法をとらなくても、通常の計算から異常を検出できるのであればそれでも良いと思います。クラスタリングする、というよりも数値上の異常を探すイメージかもしれません。目的は、ステップ3で異常品と正常品を仕分けるためです。
 **3. 画像とマッチングする**
+恐らく、解析結果と画像をいきなりマッチングさせるのは困難です。
+画像は上記の入力データ以上に次元が多い（と想定される）ためです。
-恐らく、いきなり画像とマッチングさせるのは困難です。画像は上記の入力データ以上に次元が多い（と想定される）ためです。たとえば512px四方カラー画像であれば、(512*512)^3=1.8e+16(次元)になってしまうので、これらから適切な関係を見つけるのは骨が折れるためです。
+たとえば512px四方カラー画像であれば、(512*512)^3=1.8e+16(次元)になってしまうので、これらから適切な関係を見つけるのは骨が折れます。
-そのため、まずはステップ2で見つかった異常が、画像の異常と関係があるか目で見て探します。見つかった異常の画像に異常タグをつけます。そうすれば、ちょっと強引かもしれませんが、数値上の異常と画像の異常と関係が見えますね。
+そのため、少しでもとっつきやすくするために、まずはステップ2で見つかった異常が、画像の異常と関係があるか目で見て探します。見つかった異常の画像に異常という目印をつけます。そうすれば、ちょっと強引かもしれませんが、数値上の異常と画像の異常と関係が見えますね。少なくとも数値的にも見た目的にも異常だ、というものを先に見つけて目印をつけるイメージです。
-これがある程度進んでくると、正常品の画像と正常品のクラスタリング結果が出そろってくると思います。ここから入力値に対して正常品かどの異常品か学習できそうな状況になってきそうです。
+これがある程度進んでくると、正常品の画像と正常品のクラスタリング結果が出そろってくると思います。ここから入力値に対して正常品かどの異常品か学習できそうな状況になってきそうです。どうやってやるのかは課題になりますが、寄与率ではありませんが、信頼度のような指標が代わりに得られるはずです。
 使うライブラリは`Tensorflow`や`chainer`、`Torch`あたりになると思います。