現在データ処理の途中で困っております。
やりたいことはエクセルシートの全職員から
・所属が放射線、検査科
・性別が男性
という情報を抽出したいのですが、[氏名・漢字]の列に名前の重複があるため、正確な数を把握できません。
df.query('所属 in ["放射線科グループ", "検査科グループ"] and 性別=="男"' )
上記文で放射線科と検査科の男性を割り出すことはできましたが、[氏名・漢字]列に名前の重複が存在するため、重複をなくした実際の人数を把握するために、
df.drop_duplicates(subset='氏名・漢字', keep="last")
の一文を挿入しましたが、重複はなくせたもののフィルタリングしていた他の所属と女性まで表示されるようになりましたので、お力をお借りできればと思います。
また、氏名・漢字から、一部の男性の名前も併せて抽出することがもし可能であればご教授いただけますと助かります。
(特定の所属、性別、特定の一部の名前 を抽出)
質問が多くてすみません、よろしくお願い致します。
回答2件
あなたの回答
tips
プレビュー