回答編集履歴

2019/08/26 08:13

投稿

スコア21962

answer CHANGED Viewed

@@ -1,9 +1,9 @@
-Series.where をお使いください。
+Series.mask をお使いください。
-[pandas.Series.where — pandas 0.25.1 documentation](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Series.where.html)
+[pandas.Series.mask — pandas 0.25.1 documentation](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Series.mask.html)
-Series.where(条件式, 置き換える値) で「条件式」が False の要素を「置き換える値」で置換できます。
+Series.mask(条件式, 置き換える値) で「条件式」が True の要素を「置き換える値」で置換できます。
-今回の場合、値が0の要素を置き換えたいとのことなので、条件式を `df["kangoshokuin_jokinkansan"] != 0` とすることで、この条件式が False になる要素、つまり、値が0の要素は列 `kangoshokuin_jokinkasan_estimation` の値で置き換えられます。
+今回の場合、列 `kangoshokuin_jokinkansan` の値が0の要素を置き換えたいとのことなので、条件式を `df["kangoshokuin_jokinkansan"] == 0` とすることで、この条件式が True になる要素、つまり、値が0の要素は列 `kangoshokuin_jokinkasan_estimation` の値で置き換えられます。
 ```python
 import pandas as pd
@@ -22,8 +22,8 @@
 # 2           21                  0.000000                            1.319000
 # 列 kangoshokuin_jokinkansan の値が0の要素は列 kangoshokuin_jokinkasan_estimation の値で置き換える。
-df["kangoshokuin_jokinkansan"].where(
+df["kangoshokuin_jokinkansan"].mask(
-    df["kangoshokuin_jokinkansan"] != 0,
+    df["kangoshokuin_jokinkansan"] == 0,
     df["kangoshokuin_jokinkasan_estimation"],
     inplace=True,
 )
@@ -54,8 +54,8 @@
 # 2           21                  0.000000                            1.319000
 # 列 kangoshokuin_jokinkansan の値が0の要素は列 kangoshokuin_jokinkasan_estimation の値で置き換える。
-df["kangoshokuin_jokinkansan"].where(
+df["kangoshokuin_jokinkansan"].mask(
-    ~np.isclose(df["kangoshokuin_jokinkansan"], 0),
+    np.isclose(df["kangoshokuin_jokinkansan"], 0),
     df["kangoshokuin_jokinkasan_estimation"],
     inplace=True,
 )

2019/08/26 08:13

投稿

tiitoi

スコア21962

answer CHANGED Viewed

@@ -28,4 +28,36 @@
     inplace=True,
 )
 print(df)
+```
+## 補足
+ちなみに `kangoshokuin_jokinkansan` の値がなんらかの演算結果として算出された値である場合、数値計算は丸め誤差が発生するので、理論上0になるはずでも通常は厳密に0にはなりません。
+そのため、浮動小数点数同士の値の比較は numpy.isclose を使うほうが好ましいです。
+[numpy.isclose — NumPy v1.15 Manual](https://docs.scipy.org/doc/numpy-1.15.0/reference/generated/numpy.isclose.html)
+```python
+import pandas as pd
+df = pd.DataFrame(
+    {
+        "jigyosho_id": [0, 1, 21],
+        "kangoshokuin_jokinkansan": [1, 0.954538, 0],
+        "kangoshokuin_jokinkasan_estimation": [2.859272, 0.318179, 1.319],
+    }
+)
+print(df)
+#    jigyosho_id  kangoshokuin_jokinkansan  kangoshokuin_jokinkasan_estimation
+# 0            0                  1.000000                            2.859272
+# 1            1                  0.954538                            0.318179
+# 2           21                  0.000000                            1.319000
+# 列 kangoshokuin_jokinkansan の値が0の要素は列 kangoshokuin_jokinkasan_estimation の値で置き換える。
+df["kangoshokuin_jokinkansan"].where(
+    ~np.isclose(df["kangoshokuin_jokinkansan"], 0),
+    df["kangoshokuin_jokinkasan_estimation"],
+    inplace=True,
+)
+print(df)
 ```