pdfファイルからcsvファイルへ変換するループを作りたい
データ解析のために、pdfファイルからcsvファイルへ変換する作業のループを
作ろうとしています。
1つずつpdfからcsvファイルに変換するコードはできていて、それをfor文でループにする際にできずに困っています。
発生している問題・エラーメッセージ
元のpdfファイルを1.pdf 2.pdf 3.pdfのように名付け、それぞれの1ページ目を1.csv 2.csv 3.csvに出力しようとしているのですが、以下のエラーがでていて、解決できていません。このエラーの解決方法を知りたいです。
今は3つのファイルでやっていますが、これができたら数を増やして実行する予定です。
コードにつきましても、よい修正方法があれば教えてください
エラーメッセージ expected str, bytes or os.PathLike object, not int ### 該当のソースコード import pandas as pd import tabula for i in range(1, 3): dfs[i] =tabula.read_pdf(i, stream=True, pages= "1") df[i] in dfs[i] df[i].to_csv("i.csv")
試したこと
エラーに対してネットで調べましたが
どうしてもわからずここで質問させていただきます。
補足情報(FW/ツールのバージョンなど)
python3.7.9
質問のコードはSyntaxErrorが出ます。実際に実行したコードを掲載ください。
すいません breakを載せたままになっていました。
以下がコードになります。
import pandas as pd
import tabula
# lattice=Trueでテーブルの軸線でセルを判定
for i in range(1, 3):
dfs[i] =tabula.read_pdf(i,
stream=True,
pages= "1")
df[i] in dfs[i]
df[i].to_csv("i.csv")
dfs、dfは未定義なのでNameErrorが出ませんか?(他にも問題がありますが)
実際に実行したコードを掲載いただかないと回答が付きにくいかと思います。