質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.46%
関数

関数(ファンクション・メソッド・サブルーチンとも呼ばれる)は、はプログラムのコードの一部であり、ある特定のタスクを処理するように設計されたものです。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Q&A

解決済

2回答

1903閲覧

多クラス 線形識別関数

assa

総合スコア35

関数

関数(ファンクション・メソッド・サブルーチンとも呼ばれる)は、はプログラムのコードの一部であり、ある特定のタスクを処理するように設計されたものです。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

0グッド

0クリップ

投稿2020/04/18 10:43

編集2020/04/18 13:28

識別関数 f(x)=w1x+w0
識別関数をK(K-1)/2個用意する時はそれぞれの関数が0より大きいか小さいかできめることができます
識別関数は二次元の場合直線で表して上か下かで決めていると思います。

ここで質問です
識別関数をk個用意するとき
識別関数値が最大のクラスを識別クラスにするというこです。
図に表しているやつを見ると識別関数はクラスの領域を表しているように見えます。
二次元なら面積です。
しかし識別関数f(x)=x1+x0は二次元の場合直線は表せても領域は表せないと思います。
どういうことなんでしょうか。
イメージ説明
イメージ説明
したが直線で上が面積です

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

assa

2020/04/18 13:29

すみません。 はりました。
guest

回答2

0

ベストアンサー

まず単純な二値分類を考えます。この場合、最終ゴールをあるデータに対して真値と偽値のどちらに該当するのかを確率で表すことで判定できるようにすることと定義します。二値分類の場合、真値の確率と偽値の確率の和は1.0なので、真値の確率が得られれば偽値の確率も得られるので真値の確率を計算することがゴールになります。

二値分類できるためには境界が必要です。仮に境界上にデータがある場合、これは真偽どちらでもない状態です。先ほどの確率表現でいうと真値の確率=0.5ということです。データが真値の領域にあるということは、確率表現でいうと0.6や0.9といった値である必要があります。反対の領域なら0.3や0.2などである必要があります。
まとめると、二値分類は与えられたデータに対して境界からの距離を計算してその結果をあるクラスに属する確率を計算することということになります。

上記を出発点に多クラス分類に拡張します。今クラスが3とすると、クラス1に対して真偽、クラス2に対して真偽、クラス3に対して真偽と分解すると二値分類の拡張で答えを得ることができます。

投稿2020/04/21 10:55

R.Shigemori

総合スコア3376

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

assa

2020/04/25 08:37

ありがとうございました。
guest

0

識別関数をK(K-1)/2個用意する時はそれぞれの関数が0より大きいか小さいかできめることができます

この部分の理解が少し違います。識別モデルの場合、関数の線上をどちらでもない(真値である確率=0.5)としたうえで、この関数から離れ具合を真である(またはない)確率として表現します。二値分類の場合、この確率と0より大きいか小さいかは同じことなのですが、他クラスの場合、そのクラスに属する確率を表すことになるので、この結果をうまく使うことで識別できるようになります。

投稿2020/04/19 09:26

R.Shigemori

総合スコア3376

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

assa

2020/04/19 10:16

回答ありがとうございます。 線形識別関数 f(x)=wx 最小二乗法の場合パラメータは距離が小さくなるようにけっていされると思います。 その時は教師データを0か1にして計算を行います。 計算されたf(x)においてそのxがクラスなら1に近い値を出してほかのクラスの識別関数は0に近く なるので最大をとるとクラスが識別できる。という理解はまちがっていますか? 確率の問題をこの問題においてどの部分かわかりません。 この問題において線上は確率(0.5)と理解ができませんでした。 何度もすみません
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.46%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問