forループにより複数条件でデータを抽出する

学校のテスト結果のデータを例に、forループを用いて複数条件に当てはまるデータを抽出したいと考えています。

以下のデータにおいて、ClassがA～Dのものをキーとし、EnglishとMathが７０点より高いデータを抽出します。

試したコードによる結果と本来得られる結果が異なり、間違えている箇所の検討がつかず質問させていただきました。
素人質問で恐縮ですが、分かる方がいらっしゃたら教えていただけると幸いです。

【df1】（今回扱うデータ）

Class	Name	English	Math	Science	Society
A	田中	63	75	68	82
A	山田	74	72	83	86
B	高橋	59	65	71	81
B	佐藤	70	71	74	81
C	吉田	66	72	61	73
C	斎藤	72	67	58	69
C	小池	60	78	61	66
D	高田	88	91	92	80
D	橋本	60	79	68	77
D	工藤	79	83	85	90

※データは一部である。実際はClassはA～Zまで存在するものとする。

実際に試したコードが以下になります。

【試したコード】

Python
1
2for i in ['A', 'B', 'C', 'D']:
3    df2 = df1[(df1['Class']==i) & ((df1['English']>70) & (df1['Math']>70))]
4df2

【実行した結果】

Class	Name	English	Math	Science	Society
D	高田	88	91	92	80
D	工藤	79	83	85	90
######

【本来得られると思った結果】

Class	Name	English	Math	Science	Society
A	山田	74	72	83	86
B	佐藤	70	71	74	81
D	高田	88	91	92	80
D	工藤	79	83	85	90

forループを回すとき、リストの最後のキーであるDのみ実行されてしまうようです。

行動規範の内容に同意します

回答1件

ベストアンサー

forループでdf2に代入し、毎回df2を書き換えていることになるので、最後に代入したDのみが残るのは当たり前なのかなと思います。この場合、代入ではなく、appendして追加していくといいと思います。

python
1import pandas as pd
2df1 = pd.DataFrame([["A",100,100],["A", 50,40],["B",70,90],["C",80,90],["D",71,80]],columns=["Class", "English","Math"])
3#　空のデータフレームを作る
4df2 = df1.iloc[0:0]
5for i in ['A', 'B', 'C', 'D']:
6    temp = df1[(df1['Class']==i) & ((df1['English']>70) & (df1['Math']>70))]
7    df2 = df2.append(temp, ignore_index=True)
8df2

結果

	Class	English	 Math
0	A	   100	     100
1	C	   80	      90
2	D	   71	      80

投稿2020/06/30 19:13

編集2020/06/30 19:13

Penpen7

総合スコア698

taka0606

2020/06/30 19:38

回答ありがとうございます。基本的な知識の理解が足りていなかったのがよく分かりました。周りに聞ける人がいないので素人質問に親切に回答していただき本当に助かります。

行動規範の内容に同意します

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう！

forループにより複数条件でデータを抽出する

関連した質問