回答編集履歴

ファイルを指定してテストする方法

2022/12/05 09:00

投稿

ps_aux_grep

スコア1581

answer CHANGED Viewed

@@ -237,4 +237,37 @@
 * `ax_count`: xyzの何軸が条件に一致したかをみる(今回は最適化せず1軸固定にする)
 は今回の手法で発見できる4つの条件ですね．`optuna`で予測の最適化を行う例を示しました．今回自作したLinearWaveClassifierと精度とRandomForestClassifierのような複雑なモデルの精度を比較してみると学術研究的で良いでしょう．
-とにかく，データセットの構築から道を誤っているようでしたので，そこら辺の勉強から始められると良いかと思います．
+とにかく，データセットの構築から道を誤っているようでしたので，そこら辺の勉強から始められると良いかと思います．
+### モデル評価について
+自分でテストデータ`x_test`, `y_test``を作成して与える方法
+```Python
+model = LinearWaveClassifier()
+# 学習モデルにテストデータを与えて学習させる
+model.fit(x_train, y_train)
+x_test = np.array([
+    pd.read_csv("02.csv").values[:, :3], # 任意のcsvファイルを与えまくる
+    pd.read_csv("03.csv").values[:, :3],
+    pd.read_csv("??.csv").values[:, :3],
+    pd.read_csv("??.csv").values[:, :3],
+])
+y_test = np.array([
+    [1], # 02.csvはカーブデータを計測したものであるから1
+    [0], # 03.csvは直進データを計測したものであるから0
+    [1], # ??.csvはカーブデータを計測したものであるから1
+    [1], # ??.csvはカーブデータを計測したものであるから1
+])
+# テストデータを与えて各データの種類を推測
+y_pred = model.predict(x_test)
+# テストデータのラベルを与えて答え合わせ
+score = accuracy_score(y_test, y_pred)
+print(f"正解率：{score * 100}%")
+```
+ベタ書きでファイル指定しまくることはできます．全然スマートではないですが，応急的にこのようなことは可能です．

fix code

2022/11/21 20:02

投稿

ps_aux_grep

スコア1581

answer CHANGED Viewed

@@ -67,7 +67,7 @@
 def data_augmentation(_x, _y, roll): # 最小データ長に合わせてデータを増やせるだけ増やす
     x, y = list(), list()
-    for r in range(len(_x) - roll):
+    for r in range(0, len(_x) - roll, 3):
         x.append(_x[r: r + roll])
         y.append(_y)
     return np.array(x), np.array(y)
@@ -80,10 +80,7 @@
             data[name].append(pd.read_csv(file).values[:, :3].flatten()) # flattenすることで無理矢理1階のテンソルにする
     # 最小のデータ長min_rowを導出する．
-    min_row = 1e9
-    for k, v in data.items():
-        for x in v:
-            min_row = min(min_row, x.shape[0])
+    min_row = min([x.shape[0] for v in data.values() for x in v])
     split = 2 # 最初の2ファイルは検証用データにする
     x_train, y_train, x_valid, y_valid = list(), list(), list(), list()
@@ -133,7 +130,7 @@
 def data_augmentation(_x, _y, roll): # データを増やす．最小データ長に合わせて増やせるだけ増やす
     x, y = list(), list()
-    for r in range(len(_x) - roll):
+    for r in range(len(_x) - roll): # 1つ目のコードとの相違点であることに注意
         x.append(_x[r: r + roll])
         y.append([_y]) # 1つ目のコードとの相違点であることに注意
     return np.array(x), np.array(y)
@@ -146,10 +143,7 @@
             data[name].append(pd.read_csv(file).values[:, :3]) # flattenしない
     # 最小のデータ長min_rowを導出する．
-    min_row = 1e9
-    for k, v in data.items():
-        for x in v:
-            min_row = min(min_row, x.shape[0])
+    min_row = min([x.shape[0] for v in data.values() for x in v])
     split = 2 # 最初の2ファイルは検証用データにする
     x_train, y_train, x_valid, y_valid = list(), list(), list(), list()

restore change

2022/11/21 08:00

投稿

ps_aux_grep

スコア1581

answer CHANGED Viewed

@@ -77,7 +77,7 @@
     category = {"straight": 0, "curve": 1}
     for name in category.keys():
         for i, file in enumerate(glob(f"./data/{name}/*.csv")):
-            data[name].append(pd.read_csv(file).values[:, :3].flatten("F")) # flattenすることで無理矢理1階のテンソルにする
+            data[name].append(pd.read_csv(file).values[:, :3].flatten()) # flattenすることで無理矢理1階のテンソルにする
     # 最小のデータ長min_rowを導出する．
     min_row = 1e9

flatten to feature wise

2022/11/21 07:50

投稿

ps_aux_grep

スコア1581

answer CHANGED Viewed

@@ -77,7 +77,7 @@
     category = {"straight": 0, "curve": 1}
     for name in category.keys():
         for i, file in enumerate(glob(f"./data/{name}/*.csv")):
-            data[name].append(pd.read_csv(file).values[:, :3].flatten()) # flattenすることで無理矢理1階のテンソルにする
+            data[name].append(pd.read_csv(file).values[:, :3].flatten("F")) # flattenすることで無理矢理1階のテンソルにする
     # 最小のデータ長min_rowを導出する．
     min_row = 1e9