回答編集履歴

1

修正

2020/10/14 05:54

投稿

jeanbiego
jeanbiego

スコア3966

test CHANGED
@@ -1,6 +1,10 @@
1
- たとえば、下記のような処理でしょうか。
1
+ ~~たとえば、下記のような処理でしょうか。~~
2
2
 
3
- 県と年齢が重複している行を削除しています。
3
+ ~~県と年齢が重複している行を削除しています。~~
4
+
5
+ 完全に誤読していました。
6
+
7
+ 以下でどうでしょうか。
4
8
 
5
9
 
6
10
 
@@ -20,11 +24,11 @@
20
24
 
21
25
  3 東京 加藤 23
22
26
 
23
- 4 大阪 田中 23
27
+ 4 東京 田中 23
24
28
 
25
29
  5 東京 鈴木 24
26
30
 
27
- 6 大阪 高橋 25
31
+ 6 東京 高橋 25
28
32
 
29
33
  7 東京 斎藤 23"""
30
34
 
@@ -34,40 +38,30 @@
34
38
 
35
39
 
36
40
 
41
+ for col in df.columns:
37
42
 
43
+ if df[col].nunique() == 1:
38
44
 
39
- print(df.duplicated(subset=['県', '年齢'], keep=False))
40
-
41
- #0 True
42
-
43
- #1 True
44
-
45
- #2 True
46
-
47
- #3 True
48
-
49
- #4 False
50
-
51
- #5 False
52
-
53
- #6 False
54
-
55
- #7 True
56
-
57
- #dtype: bool
58
-
59
-
60
-
61
- df = df.drop_duplicates(subset=['県', '年齢'], keep=False)
45
+ df = df.drop(col, axis=1)
62
46
 
63
47
  print(df)
64
48
 
65
- # 名前 年齢
49
+ # 名前 年齢
66
50
 
67
- #4 大阪 田中 23
51
+ #0 田中 23
68
52
 
69
- #5 東京 鈴木 24
53
+ #1 鈴木 23
70
54
 
55
+ #2 高橋 23
56
+
57
+ #3 加藤 23
58
+
59
+ #4 田中 23
60
+
61
+ #5 鈴木 24
62
+
71
- #6 大阪 高橋 25
63
+ #6 高橋 25
64
+
65
+ #7 斎藤 23
72
66
 
73
67
  ```