質問編集履歴
1
情報の追加
    
        title	
    CHANGED
    
    | 
            File without changes
         | 
    
        body	
    CHANGED
    
    | @@ -108,4 +108,70 @@ | |
| 108 108 | 
             
            In [ ]:
         | 
| 109 109 | 
             
            ```
         | 
| 110 110 | 
             
            なぜ最初のコードではstringがfloatに変換できないと言われ、
         | 
| 111 | 
            -
            次のコードではndarray(dtype=int64)がstrに変換できないと言われるのでしょうか?どう直せば良いのでしょうか?
         | 
| 111 | 
            +
            次のコードではndarray(dtype=int64)がstrに変換できないと言われるのでしょうか?どう直せば良いのでしょうか?
         | 
| 112 | 
            +
            ちなみにRandomForestClassifier以前のコードは以下のようになっています。
         | 
| 113 | 
            +
            ```ここに言語を入力
         | 
| 114 | 
            +
             | 
| 115 | 
            +
            # coding: utf-8
         | 
| 116 | 
            +
             | 
| 117 | 
            +
            # In[1]:
         | 
| 118 | 
            +
             | 
| 119 | 
            +
            import pandas as pd
         | 
| 120 | 
            +
            import matplotlib.pyplot as plt
         | 
| 121 | 
            +
            from sklearn.ensemble import RandomForestClassifier
         | 
| 122 | 
            +
            get_ipython().magic('matplotlib inline')
         | 
| 123 | 
            +
             | 
| 124 | 
            +
             | 
| 125 | 
            +
            # In[2]:
         | 
| 126 | 
            +
             | 
| 127 | 
            +
            df = pd.read_csv("Desktop/data/train.csv", delimiter=',')
         | 
| 128 | 
            +
            print(df.head())
         | 
| 129 | 
            +
            print(df.columns)
         | 
| 130 | 
            +
             | 
| 131 | 
            +
             | 
| 132 | 
            +
            # In[3]:
         | 
| 133 | 
            +
             | 
| 134 | 
            +
            mapping = {'male' : 0, 'female' : 1}
         | 
| 135 | 
            +
            df.Sex = df.Sex.replace(mapping)
         | 
| 136 | 
            +
            print(df.Sex)
         | 
| 137 | 
            +
            df.replace("male",0).replace("female",1)
         | 
| 138 | 
            +
             | 
| 139 | 
            +
             | 
| 140 | 
            +
            # In[4]:
         | 
| 141 | 
            +
             | 
| 142 | 
            +
            df["Age"].fillna(df.Age.median(),inplace=True)
         | 
| 143 | 
            +
             | 
| 144 | 
            +
             | 
| 145 | 
            +
            # In[5]:
         | 
| 146 | 
            +
             | 
| 147 | 
            +
            split_data = []
         | 
| 148 | 
            +
            for survived in [0,1]:
         | 
| 149 | 
            +
                split_data.append(df[df.Survived==survived])
         | 
| 150 | 
            +
            temp = [i["Pclass"].dropna() for i in split_data]
         | 
| 151 | 
            +
            plt.hist(temp,histtype="barstacked",bins=3)
         | 
| 152 | 
            +
             | 
| 153 | 
            +
             | 
| 154 | 
            +
            # In[6]:
         | 
| 155 | 
            +
             | 
| 156 | 
            +
            temp = [i["Age"].dropna() for i in split_data]
         | 
| 157 | 
            +
            plt.hist(temp, histtype="barstacked", bins=16)
         | 
| 158 | 
            +
             | 
| 159 | 
            +
             | 
| 160 | 
            +
            # In[7]:
         | 
| 161 | 
            +
             | 
| 162 | 
            +
            df["FamilySize"] = df["SibSp"] + df["Parch"] + 1
         | 
| 163 | 
            +
            df2 = df.drop(["Name", "SibSp", "Parch", "Ticket", "Fare", "Cabin", "Embarked"], axis=1)
         | 
| 164 | 
            +
             | 
| 165 | 
            +
             | 
| 166 | 
            +
            # In[8]:
         | 
| 167 | 
            +
             | 
| 168 | 
            +
            df2.head(10)
         | 
| 169 | 
            +
             | 
| 170 | 
            +
             | 
| 171 | 
            +
            # In[9]:
         | 
| 172 | 
            +
             | 
| 173 | 
            +
            train_data = df2.values
         | 
| 174 | 
            +
            xs = train_data[:, 2:] # Pclass以降の変数
         | 
| 175 | 
            +
            y  = train_data[:, 1]  # 正解データ
         | 
| 176 | 
            +
             | 
| 177 | 
            +
            ```
         | 
