質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

Q&A

解決済

3回答

2999閲覧

コンマとピリオドの混在した数値の置換(Python,Pandas)

MagMag

総合スコア80

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

0グッド

1クリップ

投稿2018/04/24 08:56

前提・実現したいこと

ある数値データをエクセルファイルからデータフレームに読み込んだところ、
小数点として「1.3」などピリオドでデータ入力されているところ、
打ち間違いで「2,2」といったコンマで入力された数値が入っていました。

そこで、これを文字置換関数でピリオドに変換したいのですが、うまくいかなかったので、
対応方法を教えていただけないでしょうか?

発生している問題・エラーメッセージ

#エラーではないですが、サンプルファイルの出力は以下の通りです。 #3,3は3.3になっていますが、他のデータがNaNになってしまっています。 0 NaN 1 NaN 2 NaN 3 3.3 Name: 0, dtype: object

該当のソースコード

#Python 3.6 import pandas as pd a = pd.DataFrame([0,1,2.2, "3,3"]) a_new = a[0].str.replace("\,", ".") a_new

試したこと

str.replaceやreplaceを実施したが、
期待した結果は得られませんでした。

補足情報(FW/ツールのバージョンなど)

ここにより詳細な情報を記載してください。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答3

0

ベストアンサー

python

1a = pd.DataFrame([0,1,2.2, "3,3"])

こういうこと(複数型が混在した列を作る)をすると、列の型がObject型になります。strでもfloatでもないpythonオブジェクトという扱いです。
str.replaceをそのまま適用しようとしても使い物にならないので、仕方ありませんからapplyで変換します。

python

1>>> a = pd.DataFrame([0,1,2.2, "3,3"]) 2>>> a[0].apply(lambda x: float(x.replace(",", ".")) if type(x) is str else float(x)) 30 0.0 41 1.0 52 2.2 63 3.3 7Name: 0, dtype: float64

こっちだとstr.replaceで行けますね。

python

1>>> b = pd.DataFrame(["0","1","2.2", "3,3"]) 2>>> b[0].str.replace(",", ".").astype(float) 30 0.0 41 1.0 52 2.2 63 3.3 7Name: 0, dtype: float64

投稿2018/04/24 09:07

編集2018/04/24 09:10
hayataka2049

総合スコア30933

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

MagMag

2018/04/25 05:12

ありがとうございました!以下のコードでもうまくいきました。 import pandas as pd a = pd.DataFrame([0,1,2.2, "3,3"],dtype="str") a_new = a[0].str.replace(",", ".").astype(float) a_new a_new[1]+a_new[2] #3.2
guest

0

DataFrameに投げ込む前に処理が必要だと思います。

0,1でもコンマ区切りのデータとしては正しいので、あとから変換しようにも元の構造が崩れてしまっています。

投稿2018/04/24 09:06

maisumakun

総合スコア145121

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

MagMag

2018/04/25 05:07

ありがとうございました。
guest

0

訂正:以下の問題もあるにはあると思いますが、質問者さんのコード上の問題はまず別のところ(maisumakunさんご指摘の点)にあるようです。問題点を把握できないまま間抜けなコメントしてしまい、失礼しました。

元の回答

","
が問題だろうと思います。単に
","
とすれば期待通りになるでしょう。


REPLなどから
","と打ち込むと
','
と表示されますので、これは\,という2文字を表すことがわかります。(Python 3.6)

str.replace関数は正規表現を扱うのではなく指定された文字列をそのまま(正規表現としての解釈なしに)パターンとして用いますので","と書いてしまうと「バックスラッシュとカンマの2文字が連続している箇所をピリオドに置き換える」という意味になってしまうのです。

教訓:どんな場面でどのようにエスケープシーケンスが解釈されるかよく把握して使いましょう。

投稿2018/04/24 09:06

編集2018/04/24 09:10
KSwordOfHaste

総合スコア18392

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

MagMag

2018/04/25 05:07

ありがとうございました。ただ、”,"にしても結果は変わりませんでした。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問