前提・実現したいこと
日本語が埋め込まれているPDFをpdf2imageでpngに変換したいです。
発生している問題・該当のソースコード
下記コードにてページごとのpngは出力されるのですが、日本語部分が消えてしまいます。
python
1from pathlib import Path 2from pdf2image import convert_from_path 3 4path_name = 'image/' 5pdf_path = Path('file.pdf') 6img_path=Path(path_name) 7fmt = 'png' 8convert_from_path(pdf_path, output_folder=img_path,fmt=fmt,output_file=pdf_path.stem)
試したこと
下記URLを参考に必要なフォントをインストールしようとしたのですが、
実行機がWindows10のためyum installが使えません。
https://qiita.com/m-shimao/items/98cacdfe1c55edff0867
ちなみにLinux(Ubuntu 20.04.3 LTS)機で実行した場合は日本語部分も出力されます。
補足情報(FW/ツールのバージョンなど)
Windows 10 Pro 64bit
Python 3.8.10
pdf2image 1.16.0
poppler-utils 0.1.0
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2022/01/04 02:42