現在、機械学習時に用いるエンコーディングの方法について学習しています。そこでターゲットエンコーディングの手法に1つであるholdout TSについて質問です。調べた内容では、
「Holdout TSを交差させて全データに適用したものである。特定の割合でデータを学習用とホールドアウトに分割し、学習用のデータを用いて計算した平均値をホールドアウトの特徴量として使用する」とありましたが理解できているかわかりません。以下に自分なりに理解した内容を図示したものを示します。
内容としては上記のようなことであっているのでしょうか、また、このような方法であると、例えば同じカテゴリ名でも違う値を取ってしまうということになると思いますが、問題ないのでしょうか。まだ機械学習について学習し始めた段階で申し訳ないのですが
、教えていただけると助かります。よろしくお願いします。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。