質問するログイン新規登録

質問編集履歴

1

情報の追加

2017/08/26 15:05

投稿

退会済みユーザー
title CHANGED
File without changes
body CHANGED
@@ -108,4 +108,70 @@
108
108
  In [ ]:
109
109
  ```
110
110
  なぜ最初のコードではstringがfloatに変換できないと言われ、
111
- 次のコードではndarray(dtype=int64)がstrに変換できないと言われるのでしょうか?どう直せば良いのでしょうか?
111
+ 次のコードではndarray(dtype=int64)がstrに変換できないと言われるのでしょうか?どう直せば良いのでしょうか?
112
+ ちなみにRandomForestClassifier以前のコードは以下のようになっています。
113
+ ```ここに言語を入力
114
+
115
+ # coding: utf-8
116
+
117
+ # In[1]:
118
+
119
+ import pandas as pd
120
+ import matplotlib.pyplot as plt
121
+ from sklearn.ensemble import RandomForestClassifier
122
+ get_ipython().magic('matplotlib inline')
123
+
124
+
125
+ # In[2]:
126
+
127
+ df = pd.read_csv("Desktop/data/train.csv", delimiter=',')
128
+ print(df.head())
129
+ print(df.columns)
130
+
131
+
132
+ # In[3]:
133
+
134
+ mapping = {'male' : 0, 'female' : 1}
135
+ df.Sex = df.Sex.replace(mapping)
136
+ print(df.Sex)
137
+ df.replace("male",0).replace("female",1)
138
+
139
+
140
+ # In[4]:
141
+
142
+ df["Age"].fillna(df.Age.median(),inplace=True)
143
+
144
+
145
+ # In[5]:
146
+
147
+ split_data = []
148
+ for survived in [0,1]:
149
+ split_data.append(df[df.Survived==survived])
150
+ temp = [i["Pclass"].dropna() for i in split_data]
151
+ plt.hist(temp,histtype="barstacked",bins=3)
152
+
153
+
154
+ # In[6]:
155
+
156
+ temp = [i["Age"].dropna() for i in split_data]
157
+ plt.hist(temp, histtype="barstacked", bins=16)
158
+
159
+
160
+ # In[7]:
161
+
162
+ df["FamilySize"] = df["SibSp"] + df["Parch"] + 1
163
+ df2 = df.drop(["Name", "SibSp", "Parch", "Ticket", "Fare", "Cabin", "Embarked"], axis=1)
164
+
165
+
166
+ # In[8]:
167
+
168
+ df2.head(10)
169
+
170
+
171
+ # In[9]:
172
+
173
+ train_data = df2.values
174
+ xs = train_data[:, 2:] # Pclass以降の変数
175
+ y = train_data[:, 1] # 正解データ
176
+
177
+ ```