まず、ロジスティック回帰分析(ロジスティック回帰モデリング)について説明しますが、この分析手法は1つの目的変数 y と複数の説明変数 x.1, . . . , x.p の間の関係性を線形式のモデルy=b.0+ b.1 x.1 + ... + b.p x.pで表すことを目的にしています。しかし、ロジスティック回帰では y の値が 0 or 1 であるのに対し x.1, . . . , x.pの値は (-無限〜無限)の値を取るため、上手くモデルを当てはめることができません。そこで、z=log(y/(1-y)) と変形した z に対し、前述の線形式のモデルを当てはめ、その z を y=1/{1+exp(-z)} と変換することで、元々の目的である y と x.1, . . . , x.p の関係を表すことができます。
さて、上記を踏まえてご質問にお答えしますが、まずトレーニングデータの y には 1(TRUEのとき) or 0 (FALSEのとき)が入っているとします。(※これは別に逆でもかまいませんが、最終的な解釈が変わります)
このとき、モデルの推定を行って得られた b.0, b.1, . . . , b.p の係数をもとにテストデータ x.1, . . . , x.p からz の値を求めると -無限から無限の値が得られ, これを y = 1/{1+exp(-z)} と変換します。
このとき得られた y の値が 0 より大きければ TRUE、0より小さければ FALSE と判断します。(このように z から y に変換すれば y の値は必ず 0〜1の間の値となります。)
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。