質問編集履歴

7

画像に修正追加

2023/02/16 05:24

投稿

do-shiro-to
do-shiro-to

スコア2

test CHANGED
File without changes
test CHANGED
@@ -9,8 +9,7 @@
9
9
 
10
10
 
11
11
  ### 追記
12
- 現状のGoogleDriveの状態を画像になってしまいますが添付させて頂きます。
12
+
13
- ![イメージ説明](https://ddjkaamml8q8x.cloudfront.net/questions/2022-11-21/d847b0bf-9579-48ee-8ed8-f1648e562427.png)
14
13
 
15
14
  ### 実現したいこと
16
15
 
@@ -68,10 +67,8 @@
68
67
  以下のサイトを参考にしており、元々使用しているデータと違う為必要の無いコードがある可能性があります。質問文を簡潔に書くことができず、申し訳ございません。
69
68
  https://qiita.com/Hawaii/items/5831e667723b66b46fba
70
69
 
71
- 読み込んだデータは1002行7列の加速度データで線形となっており、文字数の関係上こちらに全文記載することはできませんが画像と、序盤の30行ほどを記載させて頂きます。
70
+ 読み込んだデータは1002行7列の加速度データで線形となっており、文字数の関係上こちらに全文記載することはできませんが、序盤の30行ほどを記載させて頂きます。
72
71
 
73
- 画像
74
- ![イメージ説明](https://ddjkaamml8q8x.cloudfront.net/questions/2022-11-11/300dcd6c-ef09-4c50-9157-95cb9c6fe371.png)
75
72
 
76
73
  x,y,z,re,xt,abs,t
77
74
  -0.026031,-0.976059,0.119003,0.983631282,0,0.026031,straight

6

画像を変更しました

2022/12/07 19:43

投稿

do-shiro-to
do-shiro-to

スコア2

test CHANGED
File without changes
test CHANGED
@@ -105,8 +105,6 @@
105
105
  -0.220535,-1.044144,0.092484,1.071179569,0,0.220535,straight
106
106
 
107
107
 
108
- 2022/12/05追加
109
- ![イメージ説明](https://ddjkaamml8q8x.cloudfront.net/questions/2022-12-05/807ad21f-94a2-4248-b64e-af8fa17f25c3.png)
110
108
 
111
109
 
112
110
 

5

画像を追加しました

2022/12/04 17:27

投稿

do-shiro-to
do-shiro-to

スコア2

test CHANGED
File without changes
test CHANGED
@@ -105,4 +105,8 @@
105
105
  -0.220535,-1.044144,0.092484,1.071179569,0,0.220535,straight
106
106
 
107
107
 
108
+ 2022/12/05追加
109
+ ![イメージ説明](https://ddjkaamml8q8x.cloudfront.net/questions/2022-12-05/807ad21f-94a2-4248-b64e-af8fa17f25c3.png)
108
110
 
111
+
112
+

4

画像を追記とさせて頂きました。

2022/11/21 04:24

投稿

do-shiro-to
do-shiro-to

スコア2

test CHANGED
File without changes
test CHANGED
@@ -8,6 +8,9 @@
8
8
  なにかアドバイスを頂ければ幸いです。
9
9
 
10
10
 
11
+ ### 追記
12
+ 現状のGoogleDriveの状態を画像になってしまいますが添付させて頂きます。
13
+ ![イメージ説明](https://ddjkaamml8q8x.cloudfront.net/questions/2022-11-21/d847b0bf-9579-48ee-8ed8-f1648e562427.png)
11
14
 
12
15
  ### 実現したいこと
13
16
 

3

コードの一部を変更、出力結果に変化は見られず

2022/11/13 08:05

投稿

do-shiro-to
do-shiro-to

スコア2

test CHANGED
File without changes
test CHANGED
@@ -24,10 +24,9 @@
24
24
  ### 該当のソースコード
25
25
 
26
26
  ```GoogleColaboratory
27
- import pandas as pd#pandasのインポート
27
+ import pandas as pd
28
- import datetime#元データの日付処理のためにインポート
29
- from sklearn.model_selection import train_test_split#データ分割用
28
+ from sklearn.model_selection import train_test_split
30
- from sklearn.ensemble import RandomForestClassifier#ランダムフォレスト
29
+ from sklearn.ensemble import RandomForestClassifier
31
30
 
32
31
  df = pd.read_csv("k100xt_v2.csv")
33
32
 
@@ -46,11 +45,11 @@
46
45
  y = df["t"].values
47
46
  X = train_data.values
48
47
 
49
- X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=1234)
48
+ X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=0)
50
49
 
51
50
  X_train.shape,X_test.shape,y_train.shape,y_test.shape
52
51
 
53
- clf = RandomForestClassifier(random_state=1234)
52
+ clf = RandomForestClassifier(random_state=0)
54
53
  clf.fit(X_train, y_train)
55
54
  print("score=", clf.score(X_test, y_test))
56
55
 

2

元々質問していた内容を解決することはできたが,その後に別の問題が発生したため質問を修正

2022/11/11 11:44

投稿

do-shiro-to
do-shiro-to

スコア2

test CHANGED
@@ -1 +1 @@
1
- valueerrorを解決し、RandomForestの学習成功させたい
1
+ RandomForestの精度評価正確に反映させたい
test CHANGED
@@ -1,8 +1,9 @@
1
1
  ### 前提
2
2
 
3
- 時系列データをRandomForestで分類しようとしています。
3
+ 時系列データをRandomForestClassifierで分類しようとしています。
4
- 学習データを分割しようとしたときにvalueerrorが発生してしまいました。
4
+ 先程までは、valueerrorが発生してしまうとう質問だったのですが、データ内容を変更した所、エラーは解消されました。
5
- トレーニングセットが空とうメッセージが出てきています。
5
+ しかし、その後のclf = RandomForestClassifier~~~で行った精度評価に違和感を覚えてしま、こちらで質問内容を変更させたく、修正しおります。
6
+
6
7
  機械学習は初めて触っており、分からないことばかりなので不十分な質問になってしまっていたら申し訳ございません。
7
8
  なにかアドバイスを頂ければ幸いです。
8
9
 
@@ -11,19 +12,13 @@
11
12
  ### 実現したいこと
12
13
 
13
14
  ここに実現したいことを箇条書きで書いてください。
15
+
14
- - [ ] valueerrorをなくしてRandomForest実装を成功させたい
16
+ - [ ] RandomForestClassifierを実装した時に、どのデータ使用しても精度が100%になってしまう原因を知り、正確な出力ができるよう対処したい
15
17
 
16
18
  ### 発生している問題・エラーメッセージ
17
19
 
18
20
  ```
19
- ValueError Traceback (most recent call last)
20
- <ipython-input-20-283f8daa04e2> in <module>
21
+ エラーは出ないのですが、分類の精度評価がデータを変更しても精度評価のスコアが100%になってしまいます。
21
- 3 X = train_data.values
22
- 4
23
- ----> 5 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=0)
24
-
25
-
26
- ValueError: With n_samples=0, test_size=0.3 and train_size=None, the resulting train set will be empty. Adjust any of the aforementioned parameters.
27
22
  ```
28
23
 
29
24
  ### 該当のソースコード
@@ -40,83 +35,72 @@
40
35
 
41
36
  df.head()
42
37
 
43
- df = df[(df["xt"] == "0") | (df["xt"] == "1")]
38
+ df = df[(df["t"] == "curve") | (df["t"] == "straight")]
44
39
 
45
- df["xt"] = df["xt"].replace("0",0)
40
+ df["t"] = df["t"].replace("straight",0)
46
- df["xt"] = df["xt"].replace("1",1)
41
+ df["t"] = df["t"].replace("curve",1)
47
42
 
48
43
  df = pd.get_dummies(df,drop_first = True)
49
44
 
50
- train_data = df.drop("xt", axis=1)
45
+ train_data = df.drop("x", axis=1)
51
- y = df["xt"].values
46
+ y = df["t"].values
52
47
  X = train_data.values
53
48
 
54
- X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=0)
49
+ X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=1234)
50
+
51
+ X_train.shape,X_test.shape,y_train.shape,y_test.shape
52
+
53
+ clf = RandomForestClassifier(random_state=1234)
54
+ clf.fit(X_train, y_train)
55
+ print("score=", clf.score(X_test, y_test))
56
+
55
57
  ```
56
58
 
57
59
  ### 試したこと
58
60
 
61
+ ・データの行数を300や700に変更
59
- データの読み込み自体は成功しているため、選択したパメータ問題があったのかと、変更してみましたがerrorは変わらず発生してしまい、手詰まりになってしまいました。
62
+ ・random_stateを1234から0や34などンダムに変更
60
63
 
61
64
  ### 補足情報(FW/ツールのバージョンなど)
62
65
 
63
- 以下のサイトを参考にしており、元々使用しているデータと違う為必要の無いコードがある可能性があります。簡潔に書くことができず、申し訳ございません。
66
+ 以下のサイトを参考にしており、元々使用しているデータと違う為必要の無いコードがある可能性があります。質問文を簡潔に書くことができず、申し訳ございません。
64
67
  https://qiita.com/Hawaii/items/5831e667723b66b46fba
65
68
 
66
- 読み込んだデータは1002行5列の加速度データで線形となっており、文字数の関係上こちらに全文記載することはできませんが画像と、序盤の50行ほどを記載させて頂きます。
69
+ 読み込んだデータは1002行7列の加速度データで線形となっており、文字数の関係上こちらに全文記載することはできませんが画像と、序盤の30行ほどを記載させて頂きます。
67
70
 
68
71
  画像
69
- ![イメージ説明](https://ddjkaamml8q8x.cloudfront.net/questions/2022-11-11/f6511391-326d-4acb-a177-4694a6bf3cf3.png)
72
+ ![イメージ説明](https://ddjkaamml8q8x.cloudfront.net/questions/2022-11-11/300dcd6c-ef09-4c50-9157-95cb9c6fe371.png)
70
73
 
71
- x,y,z,re,xt
74
+ x,y,z,re,xt,abs,t
72
- -0.026031,-0.976059,0.119003,0.983631282,0
75
+ -0.026031,-0.976059,0.119003,0.983631282,0,0.026031,straight
73
- -0.064987,-1.03804,0.12355,1.047384817,0
76
+ -0.064987,-1.03804,0.12355,1.047384817,0,0.064987,straight
74
- -0.004471,-0.995529,0.139633,1.005283718,0
77
+ -0.004471,-0.995529,0.139633,1.005283718,0,0.004471,straight
75
- -0.085449,-0.960175,0.097488,0.968886718,0
78
+ -0.085449,-0.960175,0.097488,0.968886718,0,0.085449,straight
76
- 0.035767,-0.907028,0.14296,0.918921451,0
79
+ 0.035767,-0.907028,0.14296,0.918921451,0,0.035767,straight
77
- -0.011917,-0.894821,0.142151,0.906120049,0
80
+ -0.011917,-0.894821,0.142151,0.906120049,0,0.011917,straight
78
- 0.003983,-0.69928,0.007187,0.699328275,0
81
+ 0.003983,-0.69928,0.007187,0.699328275,0,0.003983,straight
79
- -0.078888,-0.890335,-0.034653,0.894494583,0
82
+ -0.078888,-0.890335,-0.034653,0.894494583,0,0.078888,straight
80
- 0.152542,-0.717941,-0.035721,0.734836261,0
83
+ 0.152542,-0.717941,-0.035721,0.734836261,0,0.152542,straight
81
- -0.061661,-1.015518,-0.035339,1.018001833,0
84
+ -0.061661,-1.015518,-0.035339,1.018001833,0,0.061661,straight
82
- -0.096069,-1.020569,0.138306,1.034368835,0
85
+ -0.096069,-1.020569,0.138306,1.034368835,0,0.096069,straight
83
- -0.047028,-1.07959,0.099106,1.08514893,0
86
+ -0.047028,-1.07959,0.099106,1.08514893,0,0.047028,straight
84
- -0.077408,-1.119263,0.169281,1.1346355,0
87
+ -0.077408,-1.119263,0.169281,1.1346355,0,0.077408,straight
85
- 0.121902,-1.052505,0.157715,1.071214681,0
88
+ 0.121902,-1.052505,0.157715,1.071214681,0,0.121902,straight
86
- 0.021805,-1.08139,0.156631,1.092892063,0
89
+ 0.021805,-1.08139,0.156631,1.092892063,0,0.021805,straight
87
- -0.099991,-0.915634,0.155319,0.934081267,0
90
+ -0.099991,-0.915634,0.155319,0.934081267,0,0.099991,straight
88
- -0.198471,-1.043808,0.098312,1.067047856,0
91
+ -0.198471,-1.043808,0.098312,1.067047856,0,0.198471,straight
89
- 0.081284,-1.092499,0.100479,1.100116895,0
92
+ 0.081284,-1.092499,0.100479,1.100116895,0,0.081284,straight
90
- -0.296371,-0.95253,0.216736,1.020844584,0
93
+ -0.296371,-0.95253,0.216736,1.020844584,0,0.296371,straight
91
- 0.122726,-0.81517,0.036789,0.82517709,0
94
+ 0.122726,-0.81517,0.036789,0.82517709,0,0.122726,straight
92
- -0.082077,-0.774368,-0.265396,0.82268917,0
95
+ -0.082077,-0.774368,-0.265396,0.82268917,0,0.082077,straight
93
- -0.155334,-0.872314,-0.045181,0.887187516,0
96
+ -0.155334,-0.872314,-0.045181,0.887187516,0,0.155334,straight
94
- -0.10614,-1.170898,0.0047,1.175708261,0
97
+ -0.10614,-1.170898,0.0047,1.175708261,0,0.10614,straight
95
- -0.02742,-1.092712,0.263962,1.12447646,0
98
+ -0.02742,-1.092712,0.263962,1.12447646,0,0.02742,straight
96
- -0.108902,-1.078354,0.145279,1.093532342,0
99
+ -0.108902,-1.078354,0.145279,1.093532342,0,0.108902,straight
97
- -0.191116,-0.966019,-0.031448,0.985244645,0
100
+ -0.191116,-0.966019,-0.031448,0.985244645,0,0.191116,straight
98
- -0.052795,-0.955856,-0.029785,0.957776149,0
101
+ -0.052795,-0.955856,-0.029785,0.957776149,0,0.052795,straight
99
- -0.081512,-1.054367,0.057022,1.059049331,0
102
+ -0.081512,-1.054367,0.057022,1.059049331,0,0.081512,straight
100
- -0.220535,-1.044144,0.092484,1.071179569,0
103
+ -0.220535,-1.044144,0.092484,1.071179569,0,0.220535,straight
101
- -0.313354,-0.99823,0.051025,1.047500555,1
102
- -0.166382,-0.902069,0.076401,0.92046106,0
103
- -0.411728,-1.007874,0.021545,1.088941749,1
104
- -0.189758,-1.038223,0.084778,1.058821234,0
105
- -0.344147,-1.023483,0.116943,1.086107856,1
106
- -0.338577,-0.977509,0.06813,1.036725579,1
107
- -0.259323,-1.003769,-0.056488,1.038263703,0
108
- -0.381851,-0.953232,0.009369,1.026912465,1
109
- -0.274139,-0.957489,-0.098862,1.00085517,0
110
- -0.267242,-0.822067,0.042496,0.865458462,0
111
- -0.425873,-0.942535,-0.102859,1.039384439,1
112
- -0.432663,-0.962418,-0.0242,1.05547682,1
113
- -0.377899,-1.112137,-0.183289,1.18880243,1
114
- -0.653488,-0.946426,-0.014297,1.150205696,1
115
- -0.469025,-1.198502,-0.002884,1.28701197,1
116
- -0.214813,-1.12233,-0.088379,1.146115222,0
117
- -0.372772,-1.120621,0.079895,1.183694893,1
118
- -0.438629,-1.055878,-0.059448,1.144905156,1
119
- -0.355606,-0.914886,0.088623,0.985558753,1
120
- -0.383453,-0.909866,-0.148544,0.998477672,1
121
104
 
122
105
 
106
+

1

コードの参考にしたサイトを記載しました。

2022/11/11 06:34

投稿

do-shiro-to
do-shiro-to

スコア2

test CHANGED
File without changes
test CHANGED
@@ -5,6 +5,8 @@
5
5
  トレーニングセットが空というメッセージが出てきてしまいます。
6
6
  機械学習は初めて触っており、分からないことばかりなので不十分な質問になってしまっていたら申し訳ございません。
7
7
  なにかアドバイスを頂ければ幸いです。
8
+
9
+
8
10
 
9
11
  ### 実現したいこと
10
12
 
@@ -57,6 +59,9 @@
57
59
  データの読み込み自体は成功しているため、選択したパラメータに問題があったのかと、変更してみましたがerrorは変わらず発生してしまい、手詰まりになってしまいました。
58
60
 
59
61
  ### 補足情報(FW/ツールのバージョンなど)
62
+
63
+ 以下のサイトを参考にしており、元々使用しているデータと違う為必要の無いコードがある可能性があります。簡潔に書くことができず、申し訳ございません。
64
+ https://qiita.com/Hawaii/items/5831e667723b66b46fba
60
65
 
61
66
  読み込んだデータは1002行5列の加速度データで線形となっており、文字数の関係上こちらに全文記載することはできませんが画像と、序盤の50行ほどを記載させて頂きます。
62
67
 
@@ -113,3 +118,5 @@
113
118
  -0.438629,-1.055878,-0.059448,1.144905156,1
114
119
  -0.355606,-0.914886,0.088623,0.985558753,1
115
120
  -0.383453,-0.909866,-0.148544,0.998477672,1
121
+
122
+