teratail header banner
teratail header banner
質問するログイン新規登録

回答編集履歴

2

誤記

2020/05/22 00:46

投稿

zenji0705
zenji0705

スコア69

answer CHANGED
@@ -3,8 +3,6 @@
3
3
  import glob
4
4
  import os
5
5
 
6
- datafiles = glob.glob("/temp/*.xlsx")
7
-
8
6
  df = pd.DataFrame()
9
7
  df_add = pd.DataFrame()
10
8
 

1

誤記

2020/05/22 00:46

投稿

zenji0705
zenji0705

スコア69

answer CHANGED
@@ -1,11 +1,9 @@
1
- dropnaはわかるということなので、ファイル名をつなげるところだけ抜粋しました。不要列を削除していただければ想定する結果になると思います。
2
-
3
1
  ```python3
4
2
  import pandas as pd
5
3
  import glob
6
4
  import os
7
5
 
8
- datafiles = glob.glob("data/sample/*.xlsx")
6
+ datafiles = glob.glob("/temp/*.xlsx")
9
7
 
10
8
  df = pd.DataFrame()
11
9
  df_add = pd.DataFrame()
@@ -13,23 +11,22 @@
13
11
  for datafiles in glob.glob("/temp/*.xlsx"):
14
12
  file_name = os.path.split(datafiles)[1]
15
13
  df = pd.read_excel(datafiles, parse_dates=[0])
14
+ df= df.dropna(how='all')
16
15
  df = df.assign(xlsx=file_name)
17
16
  df_add = df_add.append(df)
18
17
 
19
18
  print(df_add)
20
19
  ```
21
20
 
22
- このままだと下記結果になります。
21
+ 下記結果になります。
23
22
 
24
23
  index ID name area xlsx
25
24
  0 10.0 佐藤 東京都 aaa.xlsx
26
- 1 NaN NaN NaN aaa.xlsx
27
25
  2 21.0 田中 千葉県 aaa.xlsx
28
26
  3 34.0 高山 栃木県 aaa.xlsx
29
27
  4 55.0 斎藤 東京都 aaa.xlsx
30
28
  0 100.0 山田 神奈川県 bbb.xlsx
31
29
  1 120.0 山田 神奈川県 bbb.xlsx
32
- 2 NaN NaN NaN bbb.xlsx
33
30
  3 181.0 山田 神奈川県 bbb.xlsx
34
31
 
35
32
  ご検討ください。