質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

Q&A

解決済

2回答

411閲覧

Pandasで複数条件処理

kuma_129

総合スコア19

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

0グッド

0クリップ

投稿2021/01/18 12:27

現在データ処理の途中で困っております。

やりたいことはエクセルシートの全職員から
・所属が放射線、検査科
・性別が男性
という情報を抽出したいのですが、[氏名・漢字]の列に名前の重複があるため、正確な数を把握できません。

df.query('所属 in ["放射線科グループ", "検査科グループ"] and 性別=="男"' )

上記文で放射線科と検査科の男性を割り出すことはできましたが、[氏名・漢字]列に名前の重複が存在するため、重複をなくした実際の人数を把握するために、

df.drop_duplicates(subset='氏名・漢字', keep="last")

の一文を挿入しましたが、重複はなくせたもののフィルタリングしていた他の所属と女性まで表示されるようになりましたので、お力をお借りできればと思います。
また、氏名・漢字から、一部の男性の名前も併せて抽出することがもし可能であればご教授いただけますと助かります。
(特定の所属、性別、特定の一部の名前 を抽出)

質問が多くてすみません、よろしくお願い致します。

イメージ説明

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

TakaiY

2021/01/18 12:47

「氏名・漢字から、一部の男性の名前も併せて抽出する」というのは、具体的にどういう操作を想定していますか? 続く説明ではイメージが わきません。
kuma_129

2021/01/18 14:33

TakaiY様 ご質問ありがとうございます。うまく伝えられず申し訳ありません。 補足しますと、全体のDataFrameから条件に一致する人の数をカウントしたいと考えており、それが今回 ・所属(放射線科・検査科) ・性別(男性) ですが、ここに加えて ・氏名・漢字(特定の2人) を入れたいと思っております。
guest

回答2

0

ベストアンサー

二つの処理を組み合わせればよいです。

Python

1df.query('所属 in ["放射線科グループ", "検査科グループ"] and 性別=="男"' ).drop_duplicates(subset='氏名・漢字', keep="last")

もう少しわかりやすく書くのであれば、一時的に別の変数に保存して

Python

1df_temp = df.query('所属 in ["放射線科グループ", "検査科グループ"] and 性別=="男"' ) 2df_temp.drop_duplicates(subset='氏名・漢字', keep="last")

とすればよいです。

投稿2021/01/18 12:49

Amakaze

総合スコア313

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

kuma_129

2021/01/18 14:23

Amakaze 様 ご回答ありがとうございました! 2つの処理を組み合わせたいと考えていたので、望んだ通りの結果を返すことができました。別の変数に保存する方法も記載していただきありがとうございます。
guest

0

df.drop_duplicates()をすると、前のフィルタが効いていないということですが、df.query() は、df の内容を変更するのでなく、抽出したデータを返すのですが、そのように扱っていないのではないでしょうか?

投稿2021/01/18 12:46

TakaiY

総合スコア13790

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

kuma_129

2021/01/18 14:30

TakaiY 様 ご回答ありがとうございます。 ご指摘ではdf.query()はDataFrameの内容を破壊的に書き換える操作ではないとの気付きが得られました。勉強不足でした…
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問