Pandasを利用してデータの前処理をしております。
画像のように、複数条件を抽出し、シリーズの個数をカウントしたいと思っています。
所属を[放射線科グループ]、性別を[男性]に限定し、重複しているものを削除する条件を一緒にいれてきちんと[rows✖️columns]を表示するにはどうしたらよろしいでしょうか。
やりたいこととしては、
df = df.query('(所属=="放射線科グループ") and (性別=="男")')
df.drop_duplicates(subset='氏名・漢字', keep="last")
この3つの条件をひとつにまとめることです。
画像の1枚目は重複なく抽出できていますが、[rows✖️columns]の記載がないため、ぱっと見で何名いるのかわかりずらく、2枚目の方は[rows✖️columns]の記載があるのですが、名前の重複がかかった状態です。いろいろ&を使って試してみましたがエラーが出続けました。
コードの書き方含めて、ご指摘などありましたらお力添えいただけると幸いです。
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2020/12/13 23:09