前提
pythonでスクレイピングによってサイトから持ってきたpdfの表形式をテキスト化しエクセルに出力を自動で行うシステムを作成しています。
発生している問題・エラーメッセージ
以下のコードを実行すると
dfs = tabula.read_pdf(f"/Users/kentaro/Desktop/PYTHONSYSTEM/圭吾案件/JAPANESEYENTIBOR230105.pdf",lattice=False,pages='all') print(dfs) for df in dfs: # カラム名の名前を付ける df["Tibor"] = df["1WEEK"] * 1000 df=df.rename(columns={"Unnamed: 0":"日付"}) print(df)
以下のエラーコードが出ました。
エラーメッセージ name 'df' is not defined
試したこと
pdfのデータがその月の初旬だとデータが少ないせいかうまく読み込めません。
JAPANESEYENTIBOR230105.pdfではなく下旬あたりの221227などの下旬あたりのデータを持ってくるとデータもしっかりあるためか上記のエラーは出ずにしっかり読み込むことができました。
初旬のデータで試したことは、read_pdfのパラメータlatticeをstreamに変えるなどして試したのですがうまくいきませんでした。
↑テキストかできなかったpdf

回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2023/01/06 11:54
2023/01/06 12:31
2023/01/08 03:52