質問編集履歴

1

訂正

2021/03/13 05:43

投稿

fu_3823
fu_3823

スコア81

test CHANGED
File without changes
test CHANGED
@@ -1,8 +1,8 @@
1
1
  Pyhton APIのlgbmで、単純な二値分類をしています。
2
2
 
3
- 二値分類の場合、例えば、目的変数が0と1の分類ならば、各説明変数のデータセットに対して、0,1それぞれの確を出すかと思います。そして、最終的に、閾値を決めたり活性化関数を使ったりして0,1に変換するのが一般的なやり方と考えており、そうしていました。
3
+ 二値分類の場合、例えば、目的変数が0と1の分類ならば、各説明変数のデータセットに対して、0,1に対してそれぞれの確を出すかと思います。そして、最終的に、閾値を決めたり活性化関数を使ったりして0,1に変換するのが一般的なやり方と考えており、そうしていました。
4
4
 
5
- ただ、lgbmでモデルを作る際、lgbm内での評価関数による評価は、0,1ではなく、変換前の確率値で行われているように思います。これは手法として正しいのでしょうか。というのも、モデル生成のする際に、パラメータとして"objective":"binary"はあっりますが、閾値を決めたりするような過程がなく、以下のコードのoofに格納した値も確率になっているためです。
5
+ ただ、lgbmでモデルを作る際、lgbm内での評価関数による評価は、0,1ではなく、変換前の連続値で行われているように思います。これは手法として正しいのでしょうか。というのも、モデル生成のする際に、パラメータとして"objective":"binary"はあっりますが、閾値を決めたりするような過程がなく、以下のコードのoofに格納した値も確率になっているためです。
6
6
 
7
7
 
8
8