質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
87.20%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

解決済

分類木作成後の元データでの再現方法について

manataku
manataku

総合スコア39

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

1回答

0評価

0クリップ

66閲覧

投稿2022/06/29 05:51

1,0を分類するため、DecisionTreeClassifierを実行しました。
結果のグラフは上から分岐条件が記載されて順次下へ分岐していきますが、
元のデータを記載の条件を上からフィルターしてもサンプル数が可視化した
分類木と同じ数に減っていきませんが、これは途中経過がなく、次の最適な
分岐条件にいくためで、あくまでもモデルを作成しているだけなので、
最終ノードでサンプル数10と出てもその10は元データのどれに
当たるのかを出すことはできないと理解しましたが、合ってますでしょうか。

元のデータをフィルターして同じ条件でなぞっても再現できず、
予測モデルとして、どの変数が効いているか理解できることにメリットのある手法。

初めて利用しましたので、どう解釈すれば良いのかアドバイスをお願いできないでしょうか。

import

from dtreeviz.trees import dtreeviz # 分類木作成 clf = tree.DecisionTreeClassifier( max_depth = 4) model = clf.fit(X_train, y_train)

良い質問の評価を上げる

以下のような質問は評価を上げましょう

  • 質問内容が明確
  • 自分も答えを知りたい
  • 質問者以外のユーザにも役立つ

評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

気になる質問をクリップする

クリップした質問は、後からいつでもマイページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

  • プログラミングに関係のない質問
  • やってほしいことだけを記載した丸投げの質問
  • 問題・課題が含まれていない質問
  • 意図的に内容が抹消された質問
  • 過去に投稿した質問と同じ内容の質問
  • 広告と受け取られるような投稿

評価を下げると、トップページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

まだ回答がついていません

会員登録して回答してみよう

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
87.20%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問

同じタグがついた質問を見る

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。