回答率: 85.30%

質問するログイン新規登録

トップに関する質問時系列データに対するK近傍法の閾値の決め方等

編集履歴

質問編集履歴

1

時系列データに対するk近傍法のソースコードの追記

2020/11/09 05:18

投稿

スコア16

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -18,4 +18,94 @@
 長文失礼いたします。
 ### 補足情報（FW/ツールのバージョンなど）
-Pythonを使って実装しています。
+Pythonを使って実装しています。
+```python
+import pandas as pd
+import numpy as np
+import matplotlib.pyplot as plt
+from sklearn.neighbors import NearestNeighbors
+'''
+dataをsize毎のスライス窓に分割
+'''
+def main():
+    df = pd.read_csv("20191121.csv")
+    # 余分なデータをDataFrameから削除
+    df = df.drop(['name', 'x_rad/s', 'y_rad/s', 'z_rad/s'], axis=1)
+    df = df.set_index('time')
+    #x, y, z軸加速度を視認化
+    df.plot().legend(loc='upper left')
+    # 前から2480件のx軸加速度を学習データ、その次の2479件をテストデータとする
+    # # df.iloc[2479] ---> 53845130
+    # df.iloc[2480] ---> 53845150
+    train_data = df.loc[:53845130, 'x_ags']
+    test_data = df.loc[53845150:, 'x_ags'].reset_index(drop=True)
+    # 窓幅
+    width = 30
+    # k近傍法のk
+    nk = 1
+    # 窓幅を使ってベクトルの集合を作成
+    train = embed(train_data, width)
+    test = embed(test_data, width)
+    # k近傍法でクラスタリング
+    neigh = NearestNeighbors(n_neighbors=nk)
+    neigh.fit(train)
+    # 距離を計算
+    d = neigh.kneighbors(test)[0]
+    # 距離の正規化
+    mx = np.max(d)
+    d = d / mx
+    # 訓練データ
+    plt.subplot(221)
+    plt.plot(train_data, label='Training')
+    plt.xlabel("Amplitude", fontsize=12)
+    plt.ylabel("Sample", fontsize=12)
+    plt.grid()
+    leg = plt.legend(loc=1, fontsize=15)
+    leg.get_frame().set_alpha(1)
+    # 異常度
+    plt.subplot(222)
+    plt.plot(d, label='d')
+    plt.xlabel("Amplitude", fontsize=12)
+    plt.ylabel("Sample", fontsize=12)
+    plt.grid()
+    leg = plt.legend(loc=1, fontsize=15)
+    leg.get_frame().set_alpha(1)
+    # 検証用データ
+    plt.subplot(223)
+    plt.plot(test_data, label='Test')
+    plt.xlabel("Amplitude", fontsize=12)
+    plt.ylabel("Sample", fontsize=12)
+    plt.grid()
+    leg = plt.legend(loc=1, fontsize=15)
+    leg.get_frame().set_alpha(1)
+def embed(lst, dim):
+    emb = np.empty((0, dim), float)
+    for i in range(lst.size - dim + 1):
+        tmp = np.array(lst[i:i+dim])[::-1].reshape((1, -1))
+        emb = np.append(emb, tmp, axis=0)
+    return emb
+if __name__ == '__main__':
+    main()
+```
+![左上:訓練データ,左下:テストデータ,右上:異常度](15d9983fb3b40aded89010e0bc082414.png)