質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.46%
機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Q&A

解決済

2回答

2325閲覧

ロジスティック回帰の分類精度について

kenkusaba1014

総合スコア3

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

0グッド

0クリップ

投稿2021/09/24 06:58

編集2021/09/24 14:06

初学者のものです。初歩的な質問で恐れ入ります。
ロジスティック回帰について以下2点お教え下さい。
以下の様な問題があるのですが、


イメージ説明

【1点目の質問】
答えとしては「3」なのかな(理由:要素が多い方がより明確に分類出来る)と思っていますが、
一方「1」「2」の選択肢も間違っていない気がします。
どの様な考え方をするべきなのかお教え頂く事は可能でしょうか?

【2点目の質問】
分類する為の工夫として以下が記載されています。

イメージ説明

これについては1,2,3共に×と考えています。
単純な解釈として、「説明変数が多ければ多い程、分類精度が上昇する」という解釈でよろしいでしょうか?


<0924補足:σ について>
fana様よりアドバイス頂いたσですが、シグモイド関数になります。以下ご参照下さい(某通信制スクールの問題です。回答が手に入れられず。。自分で調べなければならないという意味では十分力にはなるかとは思いますが、沼にハマってばかりです。)
すいません、私の数学的知識が乏しい為回答が出来ないのですが、この場合「σは単調増加関数」になるという事なのでしょうか・・・

イメージ説明

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

meg_

2021/09/24 09:03

学校の課題でしょうか?問題がよくない気がするのですが。
kenkusaba1014

2021/09/24 14:10

>meg_様、 コメントありがとうございます。某スクールの問題です。 多分私の説明&理解が悪く前提条件をキチンと説明出来ていないのだと思います。申し訳ありません。
meg_

2021/09/25 01:34

> 某通信制スクールの問題です。回答が手に入れられず。。自分で調べなければならないという意味では十分力にはなるかとは思いますが、沼にハマってばかりです。 スクール受講されているのであれば講師にどんどん質問して良いと思います。
guest

回答2

0

ベストアンサー

【1点目の質問】

答えとしては「3」なのかな(理由:要素が多い方がより明確に分類出来る)と思っていますが、
一方「1」「2」の選択肢も間違っていない気がします。

X1が0のときYは1も0もあります。そうなるとX1だけでは決められないです。(X2も同様)なので1、2は間違いだと思います。一般的には3が正解になりそうですが、今回の問題では4が正解だと思います。(図を書くと分かりやすいかと思います)

【2点目の質問】

分類する為の工夫として以下が記載されています。
これについては1,2,3共に×と考えています。
単純な解釈として、「説明変数が多ければ多い程、分類精度が上昇する」という解釈でよろしいでしょうか?

1は1点目の質問より間違い、3は一般にはオーバーフィッテイングしやすくなります。2はオーバーフィッティングを避ける方法として行います。
しかし今回の問題においては何が正解かよく分かりません。
正解は3でしょうか。(Pythonで試したら分類できそうでした)

投稿2021/09/25 01:09

編集2021/09/25 01:29
meg_

総合スコア10607

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

kenkusaba1014

2021/09/25 12:22

ご指導ありがとうございます。特に2点目の質問についてはpythonで試すという視点がなかったので、一度やってみた後に備忘の為にコードを掲載したいと思います(まだまだかかりそうですが・・)。もしお時間があればご一読頂きコメント頂ければ嬉しいです。
guest

0

ロジスティック回帰とかいうのをまともに知らぬ者ですが…

【1点目の質問】

まず関数σが何なのかすらわかりませんが…
その引数になっている式はいずれも一次式と見えます.

横軸をx1, 縦軸をx2 とした2次元平面における y=0, y=1 の存在箇所を考えると,
どうにも一次式(直線)で「分類」できるとは見えません.

なので,関数σ が単純な形状の関数なのであれば「4.かな」という気がします.

【2点目の質問】

x1,x2,y の表を眺めると「なんだろう,すごいXOR感を感じる…」という気分になってきます.
(XORのnotになってる)

なので,(x1 XOR x2) という変数を用意することが
選択肢3. の「新たな特徴量にする」という話に当てはまるのであれば,
「3.かな」という気がします.

投稿2021/09/24 07:41

編集2021/09/24 07:45
fana

総合スコア11708

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

fana

2021/09/24 09:45

> 関数σ が単純な形状の関数なのであれば… 引数たる一次式が y=0とy=1との間に境界線を引けないので, すくなくとも関数σが単調増加関数みたいなやつだと分類は無理だと思う.
kenkusaba1014

2021/09/24 14:08

>fana様、 ご教示ありがとうございます。また、前提の説明が欠落しており申し訳ありません。 σについて追記致しました。
fana

2021/09/25 00:04

> シグモイド 「ロジスティック」という語の時点でおそらくそんな程度の(単に引数を 0~1 にマッピングするような役目しかもってなさそうな)関数がくるのだろうとは想像してましたが,まぁそういうことっすよね. > この場合「σは単調増加関数」になるという事なのでしょうか 「ロジスティック曲線」とか「シグモイド曲線」でググればどういう形状の関数なのかがわかりますよ. 引数を増やしていくと,σ(引数) の値は常に増加していきますよね. そういうのを「単調増加」と言います.
fana

2021/09/25 00:23 編集

σ(引数) の引数部分を f( x1, x2 ) と書こう. グループ1 : y=0 となる2点 (0,1), (1,0) と グループ2 : y=1 となる2点 (0,0), (1,1) とを 分類できるためには,この f( x1, x2 ) の値だけで,両グループを分類できる必要がある. すなわち,ある閾値 t によって, 「グループ1の点での f(x1,x2) の値は全て t 以下で,グループ2の点での f(x1,x2) の値は全て t より大きい」 というような形にできる必要がある. 選択肢を見ると, f( x1, x2 ) は全て1次式なので, 要は,2つのグループを区切る直線を引けるだろうか? って話になる. (で,この例だと引けないんじゃないかな,と)
fana

2021/09/25 00:19

> f( x1, x2 ) の値だけで,両グループを分類できる必要がある というのは,σ が単調増加だから. σ(引数) の値は 引数の大小関係 をそのままひきずるのだから, σの値で分類できるためには,そもそも引数の値の時点で分類できる必要があるということ.
fana

2021/09/25 00:22

……と,長々と書いたけど, 全て「ロジスティック回帰とかいうのをまともに知らぬ者」が質問文だけを見て (「ロジスティック回帰」でググることすら放棄して)好き勝手に考えを述べているだけなので, そんな話で大丈夫なのか? という判断はしっかりやってください.
kenkusaba1014

2021/09/25 12:24

ご指導ありがとうございます。fana様より頂いた内容と並行して検証させて頂きます。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.46%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問