回答編集履歴

2

誤記

2020/05/22 00:46

投稿

zenji0705
zenji0705

スコア69

test CHANGED
@@ -5,10 +5,6 @@
5
5
  import glob
6
6
 
7
7
  import os
8
-
9
-
10
-
11
- datafiles = glob.glob("/temp/*.xlsx")
12
8
 
13
9
 
14
10
 

1

誤記

2020/05/22 00:46

投稿

zenji0705
zenji0705

スコア69

test CHANGED
@@ -1,7 +1,3 @@
1
- dropnaはわかるということなので、ファイル名をつなげるところだけ抜粋しました。不要列を削除していただければ想定する結果になると思います。
2
-
3
-
4
-
5
1
  ```python3
6
2
 
7
3
  import pandas as pd
@@ -12,7 +8,7 @@
12
8
 
13
9
 
14
10
 
15
- datafiles = glob.glob("data/sample/*.xlsx")
11
+ datafiles = glob.glob("/temp/*.xlsx")
16
12
 
17
13
 
18
14
 
@@ -28,6 +24,8 @@
28
24
 
29
25
  df = pd.read_excel(datafiles, parse_dates=[0])
30
26
 
27
+ df= df.dropna(how='all')
28
+
31
29
  df = df.assign(xlsx=file_name)
32
30
 
33
31
  df_add = df_add.append(df)
@@ -40,15 +38,13 @@
40
38
 
41
39
 
42
40
 
43
- このままだと下記結果になります。
41
+ 下記結果になります。
44
42
 
45
43
 
46
44
 
47
45
  index ID name area xlsx
48
46
 
49
47
  0 10.0 佐藤 東京都 aaa.xlsx
50
-
51
- 1 NaN NaN NaN aaa.xlsx
52
48
 
53
49
  2 21.0 田中 千葉県 aaa.xlsx
54
50
 
@@ -60,8 +56,6 @@
60
56
 
61
57
  1 120.0 山田 神奈川県 bbb.xlsx
62
58
 
63
- 2 NaN NaN NaN bbb.xlsx
64
-
65
59
  3 181.0 山田 神奈川県 bbb.xlsx
66
60
 
67
61