元がcsvのデータで、数値と文字の混ざった列があります。
このままpandasのread_csvで読み込むと、「object」になります。
これを、数値と文字に分けたいのですが、方法がわかりません。
例えば、以下のように数字は整数と少数が混在しておりますが、
文字部分は日本語に限られています。
変換前 変換後
1.2 -->1.2
2後半ーー>2 ,後半
3弱 ーー>3 ,弱
3半 ーー>3 ,半
2.5 -->2.5
データフレームにしてから以下のように試してみましたが、これでは小数点を考慮できず、
「1.2」ー>「1」となってしまいました。
python
1df[カラム名].str.extract('([0-9]+)').astype(float)
正規表現もよく理解できておらず恐縮ですが、どうぞよろしくお願いいたします。
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2016/06/13 06:46
2016/06/13 06:54
2016/06/13 06:58
2016/06/13 07:11
2016/06/13 07:31
2016/06/13 07:58