Visual Studio 2019 C++ で、PDF を扱いたいのですが、適切なライブラリは何でしょうか

Question

#背景
Windows10 上で Visual Sdutio 2019 C++ でアプリケーションを開発しようとしています。まだ、VC++ を触ってから１か月程度の初心者です。表題に書いてあるとおり、PDF ファイルを扱いたいと考えていますが、とっかかりがつかめません。

#やりたいこと
たとえば、アンケート用紙が 50枚ほどあったとして、それを連続してスキャンすると PDF ファイルができます。使用する機器としては、たとえば、次のようなものを想定しています。
[ScanSnap iX500](https://scansnap.fujitsu.com/jp/product/ix500/)
このような PDF ファイルをページごとに画像として認識し、その画像データを CImage 等で処理したいと考えています。

#ソースコード
現時点では、ソースコードは、ありません。

#エラーメッセージ等
現時点では、エラーは発生していません。

#疑問点
このような作業は、Windows 10 の標準 WinAPI で実行することは可能なのでしょうか。それとも、何らかの「フリーのライブラリ」を使うべきなのでしょうか。いろいろと検索したり、teratail 内を調べたりしたのですが、うまくヒットしませんでした。

御多用中恐縮ですが、「こういうふうに検索すると情報が出てくるよ」ということでもよいので、御教授いただければ幸いです。

Accepted Answer

解決ではないのですが、次の質問に継続させていただき、引き続き勉強しようと考えております。

[https://teratail.com/questions/231802](https://teratail.com/questions/231802)

Answer

PDFのレタリングエンジンといえばChromeに組み込まれているPDFiumとかでしょうか。

多分C#でラップしているヤツのほうが使いやすい可能性があります(使ったことないし知らんけど
[https://github.com/cube-soft/Cube.Pdf/](https://github.com/cube-soft/Cube.Pdf/)

いずれにせよできればPDFとか関わり合いになりたくないものです。ろくなもんじゃない。

Answer

私も以前、pdfについて研究していた時期があったのですが、出力用のライブラリはlibHaruやGhostscriptなどがあるのですが、入力用のものはびっくりするほど少ないです。検索で出てくるものといえば下記のものぐらいです。
https://www.antenna.co.jp/pdfviewersdk/
PDFは想像以上に多機能で、機能を限定した読み取りであれば個人でもなんとかできるかもしれないレベルなのですが、汎用的なライブラリともなると、企業レベルでないとまず作成できないのが原因でしょう。

ただ、画像を抜き出す原理は説明できるので、それだけ書いておきます。

PDFファイル内の「オブジェクト」一覧をファイル末尾のテーブルから読み取る。
各オブジェクトに対し、画像かどうかの判定を行う。
画像を出力する。

https://itchyny.hatenablog.com/entry/2015/09/16/100000
このURLが参考になりますよ。

関連した質問