クラスタリングのモデル(Kshape)を保存し、新たなデータで実行したらエラーが発生

Question

### 実現したいこと telearnのKshapeを使って、ある時系列データをクラスタリングした後、ラベルデータを保存しました。そのデータを用いて新しいデータをクラスタリングしたいです。 ### 前提データフレームはインデックスに品種番号、横軸に時系列データの値を取り品種毎のクラスタリングを実施しています。また正規化は既に実施しているデータフレーム(df_clustering)です。 ``` --------------------------------------------------------------------------- AttributeError Traceback (most recent call last) in 12 # 保存したモデルを使用して予測を行う 13 #kshape_loaded.fit(forcast_array) ---> 14 new_labels_ks = kshape_loaded.predict(forcast_array) 15 print(new_labels_ks) AttributeError: 'numpy.ndarray' object has no attribute 'predict' ``` ### 該当のソースコード ```python ### 実行コード ### #K-shapeのインポート from tslearn.clustering import KShape # モデルの呼び出し with open('/content/KShape_model.pkl', 'rb') as f: kshape_loaded = pickle.load(f) print(type(kshape_loaded)) # forcast_array = np.array(df_clustering.values) print(type(forcast_array)) # # 保存したモデルを使用して予測を行う #kshape_loaded.fit(forcast_array) new_labels_ks = kshape_loaded.predict(forcast_array) print(new_labels_ks) ### ### 参考情報(保存時コード) ### #K-shapeインストール from tslearn.clustering import KShape # cluster数 n_clusters = 3 #model ks = KShape(n_clusters=n_clusters, random_state=42) labels_ks = ks.fit_predict(df_clustering_ori) #保存 with open('KShape_model.pkl', 'wb') as f: pickle.dump(labels_ks, f) ### ``` ### 試したこと・df_clusteringをnp.arrayしない・predictでなくfit_predictを使ってみる・とりあえずfitさせてから、predictしてみるの3つを実施してみましたが、特にエラーは変わりませんでした。ラベルデータがnumpy.ndarray型なので、ラベルデータを保存したことが悪かったのでしょうか。もしくはラベルデータを保存した際には特殊な処理をかますのでしょうか。保存時の処理が悪かった場合もご指摘お願いします。 ### 補足情報（FW/ツールのバージョンなど） Google Colaboratory コードの方にも書きましたが、保存した際のコードをこちらにも追記します。 ```python #K-shapeインストール from tslearn.clustering import KShape # cluster数 n_clusters = 3 #model ks = KShape(n_clusters=n_clusters, random_state=42) labels_ks = ks.fit_predict(df_clustering_ori) #保存 with open('KShape_model.pkl', 'wb') as f: pickle.dump(labels_ks, f) ```

Accepted Answer

モデルを保存する際、ラベルではなく、予測器を保存した結果、エラーが解消されました。
```python
from tslearn.clustering import KShape

# cluster数
n_clusters = 3
#model
ks = KShape(n_clusters=n_clusters, random_state=42)
labels_ks = ks.fit_predict(df_clustering_ori)

#保存
with open('KShape_model.pkl', 'wb') as f:
    # labels_ks でなく、ksを保存
    pickle.dump(ks, f)
```

実現したいこと

前提

該当のソースコード

試したこと

補足情報（FW/ツールのバージョンなど）

関連した質問