回答編集履歴

7

2倍しないとだめ!

2017/04/25 15:23

投稿

umyu
umyu

スコア5846

test CHANGED
@@ -32,7 +32,7 @@
32
32
 
33
33
  データを見ないと推測でしかいえませんが、一番あやしいポイントは「列がmecabで分けた単語」です。
34
34
 
35
- 分けた単語をファイルに出力して、クロスバリデーション分割数でファイルを分割しラベルのパターン数分以上の行列になっているか確認してみてください。
35
+ 分けた単語をファイルに出力して、クロスバリデーション分割数でファイルを分割しラベルのパターン数分*2以上の行列になっているか確認してみてください。
36
36
 
37
37
 
38
38
 

6

補足

2017/04/25 15:23

投稿

umyu
umyu

スコア5846

test CHANGED
@@ -32,7 +32,7 @@
32
32
 
33
33
  データを見ないと推測でしかいえませんが、一番あやしいポイントは「列がmecabで分けた単語」です。
34
34
 
35
- 分けた単語をファイルに出力して、クロスバリデーション分割数に対て、ラベルのパターン数分の行列になっているか確認してみてください。
35
+ 分けた単語をファイルに出力して、クロスバリデーション分割数でファイルを分割しラベルのパターン数分以上の行列になっているか確認してみてください。
36
36
 
37
37
 
38
38
 

5

言葉がぬけていたので・・

2017/04/25 15:20

投稿

umyu
umyu

スコア5846

test CHANGED
@@ -32,7 +32,7 @@
32
32
 
33
33
  データを見ないと推測でしかいえませんが、一番あやしいポイントは「列がmecabで分けた単語」です。
34
34
 
35
- 分けた単語をファイルに出力して、行列になっているか確認してみてください。
35
+ 分けた単語をファイルに出力して、クロスバリデーション分割数に対して、ラベルのパターン数分の行列になっているか確認してみてください。
36
36
 
37
37
 
38
38
 

4

cross_val_score cv2についての確認

2017/04/25 14:45

投稿

umyu
umyu

スコア5846

test CHANGED
@@ -33,3 +33,11 @@
33
33
  データを見ないと推測でしかいえませんが、一番あやしいポイントは「列がmecabで分けた単語」です。
34
34
 
35
35
  分けた単語をファイルに出力して、行列になっているか確認してみてください。
36
+
37
+
38
+
39
+ □追加確認
40
+
41
+ 一番重要なポイントを確認するの忘れてました。
42
+
43
+ cross_val_score関数のパラメータをcv=2に設定しても同じエラーメッセージは発生しますか?

3

分けた単語

2017/04/25 14:42

投稿

umyu
umyu

スコア5846

test CHANGED
@@ -32,4 +32,4 @@
32
32
 
33
33
  データを見ないと推測でしかいえませんが、一番あやしいポイントは「列がmecabで分けた単語」です。
34
34
 
35
- ファイルに出力して、行列になっているか確認してみてください。
35
+ 分けた単語をファイルに出力して、行列になっているか確認してみてください。

2

追加質問への回答

2017/04/25 13:44

投稿

umyu
umyu

スコア5846

test CHANGED
@@ -13,3 +13,23 @@
13
13
 
14
14
 
15
15
  公式ドキュメントの[チャートシート](http://scikit-learn.org/stable/tutorial/machine_learning_map/#choosing-the-right-estimator)では、最低50サンプルから始めてくださいとなってます。
16
+
17
+
18
+
19
+ ---
20
+
21
+ 追加質問への回答です。
22
+
23
+ > サンプル数が十分にあるのにこのようなエラーが出てしまうのは、行列の配列など、サンプル数を的確に処理できる形にできてないなどの「サンプル数が足りない」とは別の問題があると考えられるのですがこの推測は正しいでしょうか?
24
+
25
+
26
+
27
+ あってると思います。ベクタライザを使用していないとのことなので、
28
+
29
+ > 行が単語の塊で、列がmecabで分けた単語です。
30
+
31
+
32
+
33
+ データを見ないと推測でしかいえませんが、一番あやしいポイントは「列がmecabで分けた単語」です。
34
+
35
+ ファイルに出力して、行列になっているか確認してみてください。

1

本文に参考情報のリンクを反映

2017/04/25 13:42

投稿

umyu
umyu

スコア5846

test CHANGED
@@ -8,10 +8,8 @@
8
8
 
9
9
  クロスバリデーションの分割数と比較しサンプル数(入力データ)が少なすぎる時に発生するエラーです。
10
10
 
11
- 分割数(cv=10)を小さくするか、サンプル数を増やしてください
11
+ 分割数(cv=10)の値を小さくするか、サンプル数を増やしてください
12
12
 
13
13
 
14
14
 
15
- □参考情報
16
-
17
- 公式ドキュメントの[チャートシート](http://scikit-learn.org/stable/tutorial/machine_learning_map/#choosing-the-right-estimator)
15
+ 公式ドキュメントの[チャートシート](http://scikit-learn.org/stable/tutorial/machine_learning_map/#choosing-the-right-estimator)では、最低50サンプルから始めてくださいとなってます。