回答編集履歴

誤記

2020/05/22 00:46

投稿

スコア69

answer CHANGED Viewed

@@ -3,8 +3,6 @@
 import glob
 import os
-datafiles  = glob.glob("/temp/*.xlsx")
 df = pd.DataFrame()
 df_add = pd.DataFrame()

誤記

2020/05/22 00:46

投稿

スコア69

answer CHANGED Viewed

@@ -1,11 +1,9 @@
-dropnaはわかるということなので、ファイル名をつなげるところだけ抜粋しました。不要列を削除していただければ想定する結果になると思います。
 ```python3
 import pandas as pd
 import glob
 import os
-datafiles  = glob.glob("data/sample/*.xlsx")
+datafiles  = glob.glob("/temp/*.xlsx")
 df = pd.DataFrame()
 df_add = pd.DataFrame()
@@ -13,23 +11,22 @@
 for datafiles in glob.glob("/temp/*.xlsx"):
     file_name = os.path.split(datafiles)[1]
     df = pd.read_excel(datafiles, parse_dates=[0])
+    df= df.dropna(how='all')
     df = df.assign(xlsx=file_name)
     df_add = df_add.append(df)
 print(df_add)
 ```
-このままだと下記結果になります。
+下記結果になります。
 index      ID name  area      xlsx
 0   10.0   佐藤   東京都  aaa.xlsx
-1    NaN  NaN   NaN  aaa.xlsx
 2   21.0   田中   千葉県  aaa.xlsx
 3   34.0   高山   栃木県  aaa.xlsx
 4   55.0   斎藤   東京都  aaa.xlsx
 0  100.0   山田  神奈川県  bbb.xlsx
 1  120.0   山田  神奈川県  bbb.xlsx
-2    NaN  NaN   NaN  bbb.xlsx
 3  181.0   山田  神奈川県  bbb.xlsx
 ご検討ください。