問題
以下のようなデータフレームがあります。
都道府県名(47都道府県)と市区町村名(618種類)、面積がカラムになっております。
このDataFrameに対して、
都道府県名が北海道
の行に対して、市区町村ごとに面積の平均を求めたいです。
そこで以下のようなコードを実行したところ
# 都道府県ごとに面積当たりの価格の平均が高いところを調べたい df[df["都道府県名"]=="北海道"].groupby('市区町村名').mean()
以下のような結果が出力されます。
北海道だけ抽出したのにも関わらず、なぜかほかの県の市区町村が残っており、平均値が計算されています。
北海道の行だけが抽出されているのは確認しています。
この現象の原因がわからずこまっています。
わかる方ぜひとも教えてください。
追記
SwarmPlotを試してみても以下のようにxが各都道府県になってしまいます。
都道府県名には北海道のみなのですが、なぜでしょうか
追記2
北海道に対応する市区町村名の数を数えたところ、やはり正しいようです。
そして、categoryという欄になぜかすべての市区町村名が載っています。
回答1件
あなたの回答
tips
プレビュー