分類木作成後の元データでの再現方法について

1,0を分類するため、DecisionTreeClassifierを実行しました。
結果のグラフは上から分岐条件が記載されて順次下へ分岐していきますが、
元のデータを記載の条件を上からフィルターしてもサンプル数が可視化した
分類木と同じ数に減っていきませんが、これは途中経過がなく、次の最適な
分岐条件にいくためで、あくまでもモデルを作成しているだけなので、
最終ノードでサンプル数10と出てもその10は元データのどれに
当たるのかを出すことはできないと理解しましたが、合ってますでしょうか。

元のデータをフィルターして同じ条件でなぞっても再現できず、
予測モデルとして、どの変数が効いているか理解できることにメリットのある手法。

初めて利用しましたので、どう解釈すれば良いのかアドバイスをお願いできないでしょうか。

import
1from dtreeviz.trees import dtreeviz
2
3# 分類木作成
4clf = tree.DecisionTreeClassifier( max_depth = 4)
5model = clf.fit(X_train, y_train)

行動規範の内容に同意します

回答1件

自己解決

tree.DecisionTreeClassifier( max_depth = 4precision=0)にて表示したため、
条件（数値）が変わって見えていたようです。
tree.DecisionTreeClassifier( max_depth = 4precision=1)にしたところ正しく出せました。

投稿2022/06/29 06:17

manataku

総合スコア45