Pythonでフォルダ内にあるodfファイルのテキストデータを抽出したいのですが、
「an integer is required (got type str)」というエラーが出てしまいます。
このエラーの対処法について何かご存じであれば、ご教示頂けますと幸いです。
Python
1from pdfminer.pdfparser import PDFParser 2from pdfminer.pdfdocument import PDFDocument 3from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter 4from pdfminer.converter import TextConverter 5from pdfminer.pdfpage import PDFPage 6import csv 7import io 8import os 9import glob 10 11retstr = io.StringIO() 12csvList = [] 13files = [] 14files.append("C:/Users/ymats/OneDrive/デスクトップ/pdf Python") 15 16def pdf_mine(): 17 for i in files: 18 if i.endswith("pdf"): 19 parser = PDFParser(open('i','rb')) 20 doc = PDFDocument(parser) 21 parser.set_document(doc) 22 file_name = i 23 rsrcmgr = PDFResourceManager() 24 device = TextConverter(rsrcmgr, retstr) 25 interpreter = PDFPageInterpreter(rsrcmgr, device) 26 27 for page in PDFPage.create_pages(doc): 28 interpreter.process_page(page) 29 30 device.close() 31 result = retstr.getvalue() 32 retstr.close() 33 csvList.append([result]) 34 35 with open("C:/Users/ymats/OneDrive/デスクトップ/pdf Python","i","r",encoding="utf-8",) as f: 36 csv.writer(f).writerows(csvList) 37 38pdf_mine()
あなたの回答
tips
プレビュー