コードの内容がよくわからないです。
http://qiita.com/suzumi/items/8ce18bc90c942663d1e6 を見ながら
Kaggleのタイタニックチャレンジを再現しています。
しかし、
欠損値の扱い のところの
split_data = [] for survived in [0,1]: split_data.append(df[df.Survived==survived]) temp = [i["Pclass"].dropna() for i in split_data] plt.hist(temp,histtype="barstacked",bins=3)
がどうしてもわかりません。
データは
PassengerId,Survived,Pclass,Name,Sex,Age,SibSp,Parch,Ticket,Fare,Cabin,Embarked 1,0,3,"Braund, Mr. Owen Harris",male,22,1,0,A/5 21171,7.25,,S 2,1,1,"Cumings, Mrs. John Bradley (Florence Briggs Thayer)",female,38,1,0,PC 17599,71.2833,C85,C 3,1,3,"Heikkinen, Miss. Laina",female,26,0,0,STON/O2. 3101282,7.925,,S 4,1,1,"Futrelle, Mrs. Jacques Heath (Lily May Peel)",female,35,1,0,113803,53.1,C123,S
このようになっていて、生存したか死亡したかをここではヒストグラムで表示していると思うのですが、
どうしてこのコードでそれができるのかわかりません。
for survived in [0,1]: split_data.append(df[df.Survived==survived]) temp = [i["Pclass"].dropna() for i in split_data]
の部分がわからなくて、
df[df.Survived==survived]
で
survived
が定義されていないのにSurvivedと==の関係がTrueになることがあるのかと、
df[df.Survived==survived]
でなぜカラムが二重に定義されているのかと、
temp = [i["Pclass"].dropna() for i in split_data]
の
i["Pclass"]
が何を表現しているのか(そもそもこの書き方が可能なのか)わかりません。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。