以下のように、数値以外のデータが含まれる行をDropさせると、整数がなぜか小数点第一位表示されます。
元の整数表示にするにはどうすればよいでしょうか?
# データを表示する df1_X = pd.read_excel('【Test_欠損あり.xlsx',sheet_name='base-index') df1_X.head() id col1 col2 col3 col4 0 45 0 NaN 0 1 1 129 0 1 0 0 2 77 0 0 aaa 1 3 40 0 1 1 1 4 47 0 NaN 0 ssss
以下、数値行以外を削除すると、上記の整数が小数点第一位まで表示されてしまいます。。
# 欠損行の削除 # 2列目(2columns)から1列ずつ、最後の列まで、すべての文字→NaNに変換する(1列目はインデックスなのでそのままにする) for i in df1_X.columns[1:]: df1_X[i] = pd.to_numeric(df1_X[i], errors='coerce') # 上記の「pd.to_numeric」で、文字→NaN に変換しているので、それを含む行を一括削除 df1_X=df1_X.dropna() df1_X.head() id col1 col2 col3 col4 1 129 0.0 1.0 0.0 0.0 3 40 0.0 1.0 1.0 1.0 5 65 0.0 1.0 0.0 0.0 6 101 0.0 0.0 0.0 0.0 8 23 0.0 0.0 0.0 1.0
回答1件
あなたの回答
tips
プレビュー