##わからないこと
いつもお世話になっております。
この度zendpdfをlaravelで用いてPDFのスクレイピングを行おうとしているのですが、
日本語の文字化けを解消することができません。
コードは下記のようになっております。
パッケージはZend_PDFを使っています
php
1//ZendPdfをインポート 2use ZendPdf\PdfDocument; 3use ZendPdf\Font; 4use ZendPdf\Page; 5 6 7$childPDF = public_path().'\josei_kettei_20180131.pdf'; // windowsではバックスラッシュを使う 8// 既存ファイルの読み込み 9$pdf = PdfDocument::load($childPDF); 10// ダウンロードしたIPAフォントへのパスを指定 11$fontTTL = public_path().'\ipaexm.ttf'; 12$font = Font::fontWithPath($fontTTL); 13// フォントを32ptで適用 14$pdf->pages[0]->setFont($font, 16); 15// 文字列定義 16$text = 'てすと'; 17 18// 100pt, 600ptの位置にUTF-8で描画 19$pdf->pages[0]->drawText($text, 100, 600, 'UTF-8'); 20// ドキュメントを出力 21header ('Content-Type:', 'application/pdf'); 22header ('Content-Disposition:', 'inline;'); 23$put = $pdf->render(); 24dd($put);
対象のPDFは「http://www.kigyounaihoiku.jp/wp/wp-content/uploads/2018/02/josei_kettei_20180131.pdf」になります。
※いったん自分のPCにDLしてからスクレイピングしようとしています。
##追記 21:28
もしこの方法よりもよい手段があれば教えていただきたいです。
次のような文字化けが発生しています。
¿&.3QON!6\x16gÅAûÅÞvæñïY )úÔËbT¸¸,\x1F\x15ðXÎXp@\x1E\x1CR\x007j¯9¢ñïðoßqÖ\x7Fë\x0EÎx¥³>"Ðx YÃ\x15FYékPãp\x11·Ñk\r^uíY Ðß÷G¶
ご教授いただければ幸いです。
何卒よろしくお願い申し上げます。
回答1件
あなたの回答
tips
プレビュー