回答編集履歴
2
誤記
answer
CHANGED
@@ -3,8 +3,6 @@
|
|
3
3
|
import glob
|
4
4
|
import os
|
5
5
|
|
6
|
-
datafiles = glob.glob("/temp/*.xlsx")
|
7
|
-
|
8
6
|
df = pd.DataFrame()
|
9
7
|
df_add = pd.DataFrame()
|
10
8
|
|
1
誤記
answer
CHANGED
@@ -1,11 +1,9 @@
|
|
1
|
-
dropnaはわかるということなので、ファイル名をつなげるところだけ抜粋しました。不要列を削除していただければ想定する結果になると思います。
|
2
|
-
|
3
1
|
```python3
|
4
2
|
import pandas as pd
|
5
3
|
import glob
|
6
4
|
import os
|
7
5
|
|
8
|
-
datafiles = glob.glob("
|
6
|
+
datafiles = glob.glob("/temp/*.xlsx")
|
9
7
|
|
10
8
|
df = pd.DataFrame()
|
11
9
|
df_add = pd.DataFrame()
|
@@ -13,23 +11,22 @@
|
|
13
11
|
for datafiles in glob.glob("/temp/*.xlsx"):
|
14
12
|
file_name = os.path.split(datafiles)[1]
|
15
13
|
df = pd.read_excel(datafiles, parse_dates=[0])
|
14
|
+
df= df.dropna(how='all')
|
16
15
|
df = df.assign(xlsx=file_name)
|
17
16
|
df_add = df_add.append(df)
|
18
17
|
|
19
18
|
print(df_add)
|
20
19
|
```
|
21
20
|
|
22
|
-
|
21
|
+
下記結果になります。
|
23
22
|
|
24
23
|
index ID name area xlsx
|
25
24
|
0 10.0 佐藤 東京都 aaa.xlsx
|
26
|
-
1 NaN NaN NaN aaa.xlsx
|
27
25
|
2 21.0 田中 千葉県 aaa.xlsx
|
28
26
|
3 34.0 高山 栃木県 aaa.xlsx
|
29
27
|
4 55.0 斎藤 東京都 aaa.xlsx
|
30
28
|
0 100.0 山田 神奈川県 bbb.xlsx
|
31
29
|
1 120.0 山田 神奈川県 bbb.xlsx
|
32
|
-
2 NaN NaN NaN bbb.xlsx
|
33
30
|
3 181.0 山田 神奈川県 bbb.xlsx
|
34
31
|
|
35
32
|
ご検討ください。
|