前提
python初心者です。
下記のサイトを転用して処理を作成しています。
https://qiita.com/dakudo036/items/73d8330d383d6bf20d14
実行して期待通りの結果は取得できたのですが、
[FutureWarning: The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead.]
というメッセージが表示されており、これを解消すしたいと考えています。
実現したいこと
df = df.append(df_page)
という部分を変更する事で問題を解決したい
発生している問題・エラーメッセージ
[FutureWarning: The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead.]
該当のソースコード
for page_no, page in enumerate(pdfPages, start=1): #ページ処理 interpreter.process_page(page) #LTPageオブジェクトを取得 layout = device.get_result() #1ページ内のテキストのまとまりのリストを取得 boxes = find_textboxes(layout) #テキストひとまとまりごとに処理 for box in boxes: df_page = pd.DataFrame({"x_start":[box.x0], "text" :box.get_text().strip(), "page" :page_no} ) df = df.append(df_page) df = df.reset_index(drop=True) with open("output.csv", mode="w", encoding="cp932", errors="ignore", newline="") as f: df.to_csv(f)
試したこと
df = pd.concat([df_page])に変更したところ、df_pageの最後のページのみがcsvに出力されています。
自力で調べたり、デバッガーを使って確認はしたのですが、どうしても解決できず質問させていただきます。
補足情報(FW/ツールのバージョンなど)
ここにより詳細な情報を記載してください。

回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2022/07/21 01:28