2つのExcelの同じシート名のセルを比較して、新規ブックに出力する処理をpythonで作ろうとしてます。実行したところ、
can only compare identically-labeled dataframe objects
というエラーが出て、
df3[count]=v[v!=t]
の部分に問題があるそうですが、なぜエラーが起こったのか見当がつきません。。
for文のkとiはシート名、v,tはデータフレームが入ります。
output = input('差分結果ファイル出力先:') fol = Path(output) all_sheets = pd.read_excel("aaa.xlsx", sheet_name=None,header=None,index_col=None) all_sheets2 = pd.read_excel("bbb.xlsx", sheet_name=None,header=None,index_col=None) dfs = list(all_sheets.values()) dfs2 = list(all_sheets2.values()) differ=str(fol)+"\"+ "output.xlsx" writer = pd.ExcelWriter(differ,engine="xlsxwriter",mode="A")# pylint: disable=abstract-class-instantiated df3=dfs.copy() count=0 if len(dfs)==len(dfs2): for k, v in all_sheets.items(): for i, t in all_sheets2.items(): if i==k: df3[count]=v[v!=t] print(df3[count]) df3[count].to_excel(writer,sheet_name=i,index=False,header=False) count+=1 else: pass writer.save() writer.close() else: print("シート数が違う")
countはずっと0なので何をしたいのかがわかりません。
出力は何を期待しているのでしょう。
読み込んだ2つのExcel(それぞれ複数シートあり)のdiff結果を別の新規Excelに出力したいです。
例えば、2つのExcel(ここではaaa.xlsxとbbb.xlsx)のセルの値の違うところが、
aaa.xlsx のSheet1にてセルB5が"5" bbb.xlsxのSheet1のセルB5が"4"
aaa.xlsx のSheet2にてセルC9が"B" bbb.xlsxのSheet2のセルC9が"A"
aaa.xlsx のSheet3にてセルE4が"い" bbb.xlsxのSheet2のセルE4が"あ"
だとしたら、
新規ブック(output.xlsx)を作成して、その新規ブックで
Sheet1のセルB5に "5"
Sheet2のセルC9に "B"
Sheet3のセルE4に "い"
と出力されるようにしたいです。
df3[count]で
df3[0]:シート1枚目
df3[1]:シート2枚目
df3[2]:シート3枚目
となれば、diff結果出力先Excel(=df[count]?)で各シートにdiff結果が出力されると思ったのですが、質問で記載のエラーが出て困ってました。
回答1件
あなたの回答
tips
プレビュー