pdfの表を読み込み、excel に変換したい
Pythonでtabulaを利用してpdfをまず読み込もうと思ったのですが以下の警告がありました。解決法がわからないのでわかる方何かアドバイスがあればありがたいです。
エラーメッセージ
'pages' argument isn't specified.Will extract only from page 1 by default. Got stderr: 7月 07, 2020 11:27:29 午前 org.apache.fontbox.ttf.CmapSubtable processSubtype14 警告: Format 14 cmap table is not supported and will be ignored 7月 07, 2020 11:27:29 午前 org.apache.pdfbox.pdmodel.font.PDCIDFontType2 <init> 情報: OpenType Layout tables used in font ABCDEE+YuGothic-Regular are not implemented in PDFBox and will be ignored 7月 07, 2020 11:27:29 午前 org.apache.fontbox.ttf.CmapSubtable processSubtype14 警告: Format 14 cmap table is not supported and will be ignored 7月 07, 2020 11:27:29 午前 org.apache.fontbox.ttf.CmapSubtable processSubtype14 警告: Format 14 cmap table is not supported and will be ignored 7月 07, 2020 11:27:29 午前 org.apache.fontbox.ttf.CmapSubtable processSubtype14 警告: Format 14 cmap table is not supported and will be ignored 7月 07, 2020 11:27:29 午前 org.apache.pdfbox.pdmodel.font.PDCIDFontType2 <init> 情報: OpenType Layout tables used in font ABCDEE+YuGothic-Bold are not implemented in PDFBox and will be ignored 7月 07, 2020 11:27:29 午前 org.apache.fontbox.ttf.CmapSubtable processSubtype14 警告: Format 14 cmap table is not supported and will be ignored
該当のソースコード
python
ソースコード
from tabula import read_pdf df =read_pdf("https://www.mhlw.go.jp/content/10906000/000618483.pdf")
ここにより詳細な情報を記載してください。
あなたの回答
tips
プレビュー