PDFの表をCSVに吐き出そうとしていますが、変なところで区切られていたりし、うまく抽出できません。
表の形のままなるようには、どこを修正すべきでしょうか。
# -*- coding: utf-8 -*- import sys from tabula import read_pdf import codecs import os def find_all_files(directory): for root, dirs, files in os.walk(directory): yield root for file in files: yield os.path.join(root, file) tmp_path = os.getcwd().replace('/', os.sep) for file in find_all_files(tmp_path): name, ext = os.path.splitext(file) if(ext.find('.pdf')>-1): print(file) df = read_pdf(file, guess=False, encoding='cp932', pandas_options={'header':None}, pages='all') df.to_csv(file+".csv")

バッドをするには、ログインかつ
こちらの条件を満たす必要があります。