質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Anaconda

Anacondaは、Python本体とPythonで利用されるライブラリを一括でインストールできるパッケージです。環境構築が容易になるため、Python開発者間ではよく利用されており、商用目的としても利用できます。

OpenCV

OpenCV(オープンソースコンピュータービジョン)は、1999年にインテルが開発・公開したオープンソースのコンピュータビジョン向けのクロスプラットフォームライブラリです。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pip

pipとは、Pythonを用いて書かれているパッケージソフトのインストールや管理を行うためのパッケージマネジメントシステムです。pipを使う主なメリットは、コマンドラインインターフェースにて容易にPythonパッケージソフトをインストール可能だという点です。

Q&A

解決済

1回答

6590閲覧

PythonでPDFを画像として扱えるようにしたい

sakura_sakura

総合スコア14

Anaconda

Anacondaは、Python本体とPythonで利用されるライブラリを一括でインストールできるパッケージです。環境構築が容易になるため、Python開発者間ではよく利用されており、商用目的としても利用できます。

OpenCV

OpenCV(オープンソースコンピュータービジョン)は、1999年にインテルが開発・公開したオープンソースのコンピュータビジョン向けのクロスプラットフォームライブラリです。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pip

pipとは、Pythonを用いて書かれているパッケージソフトのインストールや管理を行うためのパッケージマネジメントシステムです。pipを使う主なメリットは、コマンドラインインターフェースにて容易にPythonパッケージソフトをインストール可能だという点です。

0グッド

0クリップ

投稿2018/12/18 07:47

編集2018/12/18 07:48

前提・実現したいこと

Pythonで、PDFファイルを画像に変換し、OpenCVで扱えるようにしたいです。

具体的には、Flaskで作成したWebページから、PDFファイルをアップロードし、
裏側でPDFを読み込んで画像に変換し、
OpenCVで解析した結果を表示できればと考えております。

調べてみたところ、pdf2imageが利用できそうなのですが、
これを利用するために、popplerもインストールする必要があるようです。

そこで、popplerのインストールを試みたところ、以下のようなエラーが発生しております。

※Python初心者のため、pdf2imageに限らず、
他に良い方法があれば、ご教授頂けますと幸いです。

発生している問題・エラーメッセージ

$pip install poppler Collecting poppler Could not find a version that satisfies the requirement poppler (from versions: ) No matching distribution found for poppler

試したこと

  1. Python3.6環境でインストール

 →NG: 同様のエラーが発生

  1. 以下サイトよりバイナリをダウンロードしてインストーを試みる

 https://blog.alivate.com.au/poppler-windows/
→NG: 7zの解凍ができない。

※解凍ツールとして、
7zip(https://sevenzip.osdn.jp/download.html)を試したところ、
exeファイルをクリックしたところで、画面が真っ暗になりフリーズしたため、
怖くなり強制終了してしまいました。

補足情報(FW/ツールのバージョンなど)

<開発環境>

  • Windows7 64bit
  • Anaconda
  • Python 3.5
  • pip 18.1

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

pythonによりpdfを画像にする方法を参考に
Win10x64,Anaconda(Python3.5.x)にて以下手順で利用できました。
pip install popllerの必要はありません。
参考まで。

  • pdf2imageのインストール

DOS

1C:\WINDOWS\system32>pip install pdf2image 2Collecting pdf2image 3 Downloading https://files.pythonhosted.org/packages/47/2a/2ca975be5be0fb7336cf38df0907117b27c9630cabb7df613d8efc74dc36 4/pdf2image-1.2.0.tar.gz 5Requirement already satisfied: pillow in c:\program files\anaconda3\lib\site-packages (from pdf2image) (5.2.0) 6Building wheels for collected packages: pdf2image 7 Running setup.py bdist_wheel for pdf2image ... done 8 Stored in directory: C:\Users\~8c2b766 9Successfully built pdf2image 10twisted 18.7.0 requires PyHamcrest>=1.9.0, which is not installed. 11Installing collected packages: pdf2image 12Successfully installed pdf2image-1.2.0
  • Poppler for Windowsからpoppler-0.68.0_x86をダウンロードする。
  • 上記を解凍しpoppler-0.68.0フォルダの中身をc:\poppler\なりにコピーする。すなわちc:\poppler\bin\pdfinfo.exeなどのように配置する。

.7zの解凍方法については拡張子が「.7z」のファイルを入手したけど解凍できない。やり方を教えて。などを参考にしてください。

  • システム環境変数のPathc:\poppler\binを追加する。

  • 以下コードで変換できることを確認。

Python

1from pdf2image import convert_from_path 2pages = convert_from_path('temp.pdf') 3for idx,page in enumerate(pages): 4 page.save('out{}.jpg'.format(idx+1), 'JPEG')

投稿2018/12/18 08:20

編集2018/12/18 08:28
can110

総合スコア38262

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

sakura_sakura

2018/12/18 08:55

ご回答誠にありがとうございます! 教えて頂いた内容で解決できました! .7zの解凍方法もありがとうございました!
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問