回答編集履歴

2021/06/02 04:08

投稿

スコア1399

answer CHANGED Viewed

@@ -69,13 +69,30 @@
 Name: 市区町村, dtype: float64
 ```
+このようにして得たシリーズをもとの`df`に再び割り当てることで、求めたい結果が得られます。
 ---
-このようにして得たシリーズをもとの`df`に再び割り当てることで、以下のような結果が得られます。
+以下に今回の操作をまとめます。
 ```python
+In [17]: pref = ["東京", "東京", "東京", "埼玉", "千葉", "神奈川"]
+    ...: value = ["渋谷", "新宿", "池袋", "大宮", "新浦安", "横浜"]
+    ...: df = pd.DataFrame({'都道府県':pref, '市区町村': value})
+    ...: dic = {"渋谷":100, "新宿":90, "大宮":50, "新浦安":45, "横浜":80}
+    ...:
+    ...: df
+Out[17]:
+  都道府県 市区町村
+0   東京   渋谷
+1   東京   新宿
+2   東京   池袋
+3   埼玉   大宮
+4   千葉  新浦安
+5  神奈川   横浜
-In [107]: df.assign(市区町村=df['市区町村'].map(dic).groupby(df['都道府県']).transform(lambda s: s.fillna(s.mean())))
+In [18]: df.assign(市区町村=df['市区町村'].map(dic).groupby(df['都道府県']).transform(lambda s: s.fillna(s.mean())))
-Out[107]:
+Out[18]:
   都道府県   市区町村
 0   東京  100.0
 1   東京   90.0

2021/06/02 04:08

投稿

スコア1399

answer CHANGED Viewed

@@ -38,9 +38,9 @@
 ---
-つづいて、値が`NaN`となっているデータを特定の値で上書きする場合には、`.fillna()`メソッドが利用できます。シリーズの平均値で欠損値を穴埋めする場合は、`Series.fillna(Series.mean))`のようにします。
+つづいて、値が`NaN`となっているデータを特定の値で上書きする場合には、`.fillna()`メソッドが利用できます。`.map()`メソッドを用いたことがここで生きてきます。`NaN`に変換したことで、わざわざ`'池袋'`をキーにした辞書ライクなものを作成する必要がなくなり、シリーズの標準のメソッドを活用することができます。
-以下はこの動作の例です。
+シリーズの平均値で欠損値を穴埋めする場合は、`Series.fillna(Series.mean))`のようにします。以下はこの動作の例です。
 ```python
 In [14]: s = pd.Series([1, 2, None, 3, 4])