質問編集履歴
1
コード、エラーの修正
test
CHANGED
File without changes
|
test
CHANGED
@@ -11,14 +11,29 @@
|
|
11
11
|
↓
|
12
12
|
同じ名前のファイルを縦方向に結合させる。(1行目のヘッダーは残し、2行目以降は結合元のヘッダーは入れない)
|
13
13
|
↓
|
14
|
-
結合したファイルを参照し、重複しているデータがあれば余分な行を削除し一行のみにする
|
14
|
+
結合したファイルを参照し、ある指定列で重複しているデータがあれば余分な行を削除し一行のみにする
|
15
15
|
↓
|
16
|
-
重複がなくなったデータを参照し、ある指定列において特定の条件を満たすデータ数を数える。
|
16
|
+
重複がなくなったデータを参照し、別のある指定列において特定の条件を満たすデータ数を数える。
|
17
17
|
|
18
18
|
を行いたいです。
|
19
19
|
|
20
20
|
### 発生している問題・エラーメッセージ
|
21
21
|
|
22
|
+
現在、このエラーが出ます。
|
23
|
+
```
|
24
|
+
KeyError: Index(['app_num'], dtype='object')
|
25
|
+
```
|
26
|
+
app_numは重複を確認して削除する際に参照する行のヘッダーです。
|
27
|
+
|
28
|
+
また、
|
29
|
+
```Python
|
30
|
+
#重複を確認
|
31
|
+
ic.duplicated()
|
32
|
+
|
33
|
+
#重複を削除
|
34
|
+
sindf = ic.drop_duplicates()
|
35
|
+
```
|
36
|
+
ここの引数を入れずに走らせると、以下のエラーが出ました。
|
22
37
|
```
|
23
38
|
KeyError: 'acai_app_dt'
|
24
39
|
```
|
@@ -58,10 +73,11 @@
|
|
58
73
|
ic = pd.DataFrame(hoge)
|
59
74
|
|
60
75
|
#重複を確認
|
61
|
-
ic.duplicated()
|
76
|
+
ic.duplicated('app_num')
|
62
77
|
|
63
78
|
#重複を削除
|
64
|
-
sindf = ic.drop_duplicates()
|
79
|
+
sindf = ic.drop_duplicates('app_num')
|
80
|
+
|
65
81
|
|
66
82
|
# CSVで保存
|
67
83
|
sindf.to_csv('upd_pmac_g_app_case.tsv', encoding='utf-8-sig')
|