質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

89.10%

forループにより複数条件でデータを抽出する

解決済

回答 1

投稿

  • 評価
  • クリップ 0
  • VIEW 95

taka0606

score 8

学校のテスト結果のデータを例に、forループを用いて複数条件に当てはまるデータを抽出したいと考えています。

以下のデータにおいて、ClassがA~Dのものをキーとし、EnglishとMathが70点より高いデータを抽出します。

試したコードによる結果と本来得られる結果が異なり、間違えている箇所の検討がつかず質問させていただきました。
素人質問で恐縮ですが、分かる方がいらっしゃたら教えていただけると幸いです。

【df1】(今回扱うデータ)

Class Name English Math Science Society
A 田中 63      75 68 82   
A 山田 74      72 83 86   
B 高橋 59      65 71 81   
B 佐藤 70      71 74 81   
C 吉田 66      72 61 73   
C 斎藤 72      67 58 69   
C 小池 60      78 61 66   
D 高田 88      91 92 80   
D 橋本 60      79 68 77   
D 工藤 79      83 85 90   

※データは一部である。実際はClassはA~Zまで存在するものとする。

実際に試したコードが以下になります。


【試したコード】

for i in ['A', 'B', 'C', 'D']:
    df2 = df1[(df1['Class']==i) & ((df1['English']>70) & (df1['Math']>70))]
df2

【実行した結果】

Class Name English Math Science Society
D 高田 88      91 92 80   
D 工藤 79      83 85 90   
 

【本来得られると思った結果】

Class Name English Math Science Society
A 山田 74      72 83 86   
B 佐藤 70      71 74 81   
D 高田 88      91 92 80   
D 工藤 79      83 85 90   

forループを回すとき、リストの最後のキーであるDのみ実行されてしまうようです。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 過去に投稿した質問と同じ内容の質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 1

checkベストアンサー

0

forループでdf2に代入し、毎回df2を書き換えていることになるので、最後に代入したDのみが残るのは当たり前なのかなと思います。この場合、代入ではなく、appendして追加していくといいと思います。

import pandas as pd
df1 = pd.DataFrame([["A",100,100],["A", 50,40],["B",70,90],["C",80,90],["D",71,80]],columns=["Class", "English","Math"])
# 空のデータフレームを作る
df2 = df1.iloc[0:0]
for i in ['A', 'B', 'C', 'D']:
    temp = df1[(df1['Class']==i) & ((df1['English']>70) & (df1['Math']>70))]
    df2 = df2.append(temp, ignore_index=True)
df2

結果

    Class    English     Math
0    A       100         100
1    C       80          90
2    D       71          80

投稿

編集

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2020/07/01 04:38

    回答ありがとうございます。基本的な知識の理解が足りていなかったのがよく分かりました。
    周りに聞ける人がいないので素人質問に親切に回答していただき本当に助かります。

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 89.10%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる