Pandasのデータフレームで、数値が入った2列のデータフレームにクラスタリングを実施したく考えております。しかし、数値が全て1000単位でカンマが入っているためか、sklearnのkMeansでエラーが出てしまいます。そこで、このデータフレーム内のカンマ区切りの数値を一括で普通の数値にしたく考えております。以下の様にしたところ、エラーが出てしまいます。
Python3
1df3.dropna(inplace=True) 2df3.apply(lambda x: x.str.replace(',','')).astype(np.int) 3
【エラー】invalid literal for int() with base 10: '0.00'
原因と対策につき、ご教示いただけますと幸いです。
回答4件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。