質問編集履歴

データの追加

2019/12/26 04:10

投稿

Fnaniel

スコア5

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -10,21 +10,64 @@
 上記サイトに似たような条件のロジスティック回帰の例が記載されていますが，このような方法が妥当なのでしょうか．．．
+A	B	C	D	E	F	Name
+50000	120	0,0,1,0,0	0,0,1	0,1,0,0	0,0,0,1	1
+35000	80	0,0,1,0,0	0,0,1	0,1,0,0	0,1,0,0	0
+20000	50	1,0,0,0,0	0,1,0	0,0,1,0	0,0,0,1	1
+42000	65	0,0,0,0,1	0,0,1	1,0,0,0	0,0,0,1	1
+51000	110	0,0,0,1,0	1,0,0	0,1,0,0	0,0,0,1	0
+23000	55	1,0,0,0,0	1,0,0	0,0,0,1	1,0,0,0	1
+38000	85	0,0,0,1,0	1,0,0	0,0,0,1	0,0,0,1	0
+46000	95	1,0,0,0,0	0,1,0	0,0,1,0	0,1,0,0	0
+4000	90	1,0,0,0,0	0,0,1	1,0,0,0	0,0,0,1	1
+19000	45	0,0,0,1,0	0,0,1	0,0,1,0	0,0,0,1	0
+これをコピーしてExcelの「A1~G11」にテキスト形式で張り付けたものと実データは全く一緒です．
+このデータは10行のテストデータですが，
+最終的には2000行あるデータで二値分類を行いたいと考えています．
 ### 発生している問題・エラーメッセージ
-```
-NameError                                 Traceback (most recent call last)
+ValueError                                Traceback (most recent call last)
-<ipython-input-1-587453287380> in <module>
+<ipython-input-11-bdb8fb2b37d7> in <module>
       1 from sklearn.tree import DecisionTreeClassifier
-      2 model = DecisionTreeClassifier(max_depth=5, random_state=0)
+      2 model = DecisionTreeClassifier(max_depth=3, random_state=0)
 ----> 3 model.fit(X, Y)
       4 model.predict(X)
+~\Anaconda3\lib\site-packages\sklearn\tree\tree.py in fit(self, X, y, sample_weight, check_input, X_idx_sorted)
+    799             sample_weight=sample_weight,
+    800             check_input=check_input,
-NameError: name 'X' is not defined
+--> 801             X_idx_sorted=X_idx_sorted)
+    802         return self
-```
+    803
+~\Anaconda3\lib\site-packages\sklearn\tree\tree.py in fit(self, X, y, sample_weight, check_input, X_idx_sorted)
+    114         random_state = check_random_state(self.random_state)
+    115         if check_input:
+--> 116             X = check_array(X, dtype=DTYPE, accept_sparse="csc")
+    117             y = check_array(y, ensure_2d=False, dtype=None)
+    118             if issparse(X):
+~\Anaconda3\lib\site-packages\sklearn\utils\validation.py in check_array(array, accept_sparse, accept_large_sparse, dtype, order, copy, force_all_finite, ensure_2d, allow_nd, ensure_min_samples, ensure_min_features, warn_on_dtype, estimator)
+    525             try:
+    526                 warnings.simplefilter('error', ComplexWarning)
+--> 527                 array = np.asarray(array, dtype=dtype, order=order)
+    528             except ComplexWarning:
+    529                 raise ValueError("Complex data not supported\n"
+~\Anaconda3\lib\site-packages\numpy\core\numeric.py in asarray(a, dtype, order)
+    536
+    537     """
+--> 538     return array(a, dtype, copy=False, order=order)
+    539
+    540
+ValueError: could not convert string to float: '0,0,1,0,0'
 ### 該当のソースコード
 ```Python
@@ -46,6 +89,8 @@
 ```
+from sklern~　以下よりエラーが生じます．
 ### 試したこと
 https://news.mynavi.jp/article/Python_ML-5/

エクセルファイルの追加

2019/12/26 04:10

投稿

Fnaniel

スコア5

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -10,6 +10,8 @@
 上記サイトに似たような条件のロジスティック回帰の例が記載されていますが，このような方法が妥当なのでしょうか．．．
 ### 発生している問題・エラーメッセージ
 ```

ソースコードの追記，説明．エラーメッセージの記載．

2019/12/26 03:01

投稿

Fnaniel

スコア5

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -13,26 +13,42 @@
 ### 発生している問題・エラーメッセージ
 ```
+NameError                                 Traceback (most recent call last)
+<ipython-input-1-587453287380> in <module>
+      1 from sklearn.tree import DecisionTreeClassifier
+      2 model = DecisionTreeClassifier(max_depth=5, random_state=0)
+----> 3 model.fit(X, Y)
-エラーメッセージ
+      4 model.predict(X)
+NameError: name 'X' is not defined
 ```
 ### 該当のソースコード
+```Python
 import pandas as pd
-df = pd.read_excel(r'C:~~~~.xlsx')
+df = pd.read_excel(r'C:\Users\AAA.xlsx') #エクセルファイルの読み込み
+df   #エクセルファイルの表示
-df
+df['Name'].value_counts()　#「Name」列の「1」,「0」の各個数表示
-df['Name'].value_counts()
-X = df.drop('Name', axis=1)
+X = df.drop('Name', axis=1)　#「Name」列以外の列を説明変数Xに設定
-Y = df['Name']
+Y = df['Name']　　　　#「Name」列を目的変数Yに設定
 X.head()
+from sklearn.tree import DecisionTreeClassifier　#機械学習ライブラリscikit-learnの中からDecisionTreeClassifier(決定木)を呼び出す
+model = DecisionTreeClassifier(max_depth=3, random_state=0)　#modelという名前で決定木を使う宣言(モデルの条件として、max_depth、random_state)
+model.fit(X, Y)　#教師データを先ほど宣言したモデルに代入して学習を実行し、機械学習モデルの作成
+model.predict(X)
+```
 ### 試したこと
+https://news.mynavi.jp/article/Python_ML-5/
-ここに問題に対して試したことを記載してください。
+上記のサイトに沿って動かしてみただけです．
+説明変数が数値じゃないのでエラーが出たんだと思います．
 ### 補足情報（FW/ツールのバージョンなど）

該当のソースコードの箇所に現在のプログラムを記載しました．

2019/12/26 01:58

投稿

Fnaniel

スコア5

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -18,10 +18,18 @@
 ### 該当のソースコード
-```ここに言語名を入力
+import pandas as pd
-ソースコード
-```
+df = pd.read_excel(r'C:~~~~.xlsx')
+df
+df['Name'].value_counts()
+X = df.drop('Name', axis=1)
+Y = df['Name']
+X.head()
 ### 試したこと
 ここに問題に対して試したことを記載してください。