dtree.predict()を実行したい。

Question

### 前提

楽天市場のレビューアーの特徴からスパムを検出するAIを作成しています。
決定木分析を行っており、訓練データで学習をし終えましたが結果を予測することができていません。

### 実現したいこと

ここに実現したいことを箇条書きで書いてください。
- dtree.predict()を使えるようにする。

### 発生している問題・エラーメッセージ

```
ValueError: X has 4 features, but DecisionTreeClassifier is expecting 3 features as input.
```

### 該当のソースコード

```python
from sklearn import tree
from dtreeviz.trees import *
import dtreeviz
import graphviz

df_past = pd.read_csv(r"C:\Users\Yasu\Documents\情報科学特別演習\csv\スパム検出済み.csv")
df_predict = pd.read_csv(r"C:\Users\Yasu\Documents\情報科学特別演習\csv\predict_data.csv")

X_name = ["reputation","age","sex"]#説明変数
y_name = "spam"#目的変数
X = df_past[X_name]
X = X.values
y = df_past[y_name]

dtree = tree.DecisionTreeClassifier(max_depth=3)
dtree.fit(X,y)

m = dtreeviz.model(dtree,X,y,
                   target_name = y_name,
                   feature_names = X_name,
                   class_names = ["not spam","spam"])

m_view = m.view()
dtree.predict(df_predict)

```
### データについて
![訓練データと予測したいデータ](https://ddjkaamml8q8x.cloudfront.net/questions/2023-01-09/c92cd07f-20ef-482e-af4c-7d844bfdddee.png)
訓練データが左で、予測データが右です。

### 試したこと

予測したいデータの欠損値をドロップさせましたが改善できませんでした。

### 補足情報（FW/ツールのバージョンなど）

windows11
IDLE

Accepted Answer

動作未検証ですが`df_predict`の読み込み時に左端のA列を含めて４列（特徴量）存在するのがエラー原因だと思われます。
読み込み時に必要な列のみを指定するか、読み込み後に`df_past`と同じく必要な列のみ抽出するとよいでしょう。