前提・実現したいこと
Pythonを利用したデータ分析初心者です。
いわゆる、タイタニックデータを利用して、決定木を使ったモデルの作成を行おうとしています。
発生している問題・エラーメッセージ
Medianで補完した変数を利用して、決定木でFitさせようとしたところ以下のエラーが出ます。
具体的に問題が発生している箇所は、「試したこと」に記載の通り、Pandasを利用してN/AのデータをMedianで補完している箇所です(median = train["Age"].median)。
median変数に格納されているデータ型がmethod型になっており、Fitがmethodを想定していないのでエラーになっているようです。
medianが正しくScalarで戻り値を返すようにしたいです。
エラーメッセージ TypeError: float() argument must be a string or a number, not 'method' ### 該当のソースコード train = pd.read_csv("train.csv") test = pd.read_csv("test.csv") # 欠損値の補完 median = train["Age"].median train["Age"] = train["Age"].fillna(median) train["Embarked"] = train["Embarked"].fillna("S") # 「train」の目的変数と説明変数の値を取得 target = train["Survived"].values features_one = train[["Pclass", "Sex", "Age", "Fare"]].values # 決定木の作成 my_tree_one = tree.DecisionTreeClassifier() my_tree_one = my_tree_one.fit(features_one, target)
試したこと
Pandasのサイトを見ると、戻り値はScalar or Seriesとなっています。
そのため、なぜmethodが格納されているのかわかっておりません。。。
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Series.median.html
補足情報(FW/ツールのバージョンなど)
Jupyter Notebookを使用
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2019/08/12 11:52