質問編集履歴

情報の追加

2017/08/26 15:05

投稿

退会済みユーザー

スコア0

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -108,4 +108,70 @@
 In [ ]:
 ```
 なぜ最初のコードではstringがfloatに変換できないと言われ、
-次のコードではndarray(dtype=int64)がstrに変換できないと言われるのでしょうか？どう直せば良いのでしょうか？
+次のコードではndarray(dtype=int64)がstrに変換できないと言われるのでしょうか？どう直せば良いのでしょうか？
+ちなみにRandomForestClassifier以前のコードは以下のようになっています。
+```ここに言語を入力
+# coding: utf-8
+# In[1]:
+import pandas as pd
+import matplotlib.pyplot as plt
+from sklearn.ensemble import RandomForestClassifier
+get_ipython().magic('matplotlib inline')
+# In[2]:
+df = pd.read_csv("Desktop/data/train.csv", delimiter=',')
+print(df.head())
+print(df.columns)
+# In[3]:
+mapping = {'male' : 0, 'female' : 1}
+df.Sex = df.Sex.replace(mapping)
+print(df.Sex)
+df.replace("male",0).replace("female",1)
+# In[4]:
+df["Age"].fillna(df.Age.median(),inplace=True)
+# In[5]:
+split_data = []
+for survived in [0,1]:
+    split_data.append(df[df.Survived==survived])
+temp = [i["Pclass"].dropna() for i in split_data]
+plt.hist(temp,histtype="barstacked",bins=3)
+# In[6]:
+temp = [i["Age"].dropna() for i in split_data]
+plt.hist(temp, histtype="barstacked", bins=16)
+# In[7]:
+df["FamilySize"] = df["SibSp"] + df["Parch"] + 1
+df2 = df.drop(["Name", "SibSp", "Parch", "Ticket", "Fare", "Cabin", "Embarked"], axis=1)
+# In[8]:
+df2.head(10)
+# In[9]:
+train_data = df2.values
+xs = train_data[:, 2:] # Pclass以降の変数
+y  = train_data[:, 1]  # 正解データ
+```

7 256 295 716