teratail header banner
teratail header banner
質問するログイン新規登録

質問編集履歴

2

追記

2020/10/29 07:06

投稿

Tera0724
Tera0724

スコア18

title CHANGED
File without changes
body CHANGED
@@ -7,7 +7,11 @@
7
7
 
8
8
  <補足>
9
9
  pyPDFに原因があると思っていましたが、その後の画像データ変換時の処理のどこかで文字化けしていることがわかりました。コードは以下の通りです。
10
+ ```python
10
11
  pdfToImage = pdf2image.convert_from_path(pdfが保存されているパス)
11
12
  imgArray = np.asarray(pdfToImage[0])
12
13
  pdfImage = cv2.cvtColor(imgArray, cv2.COLOR_RGB2BGR)
13
- cv2.imwrite("test.jpg", pdfImage)
14
+ cv2.imwrite("test.jpg", pdfImage)
15
+ ```
16
+ 出力のjpg画像については以下の通りです。
17
+ ![イメージ説明](ed8d8348c3f1a5b1acf401b9bb233e5c.png)

1

原因が違っていた

2020/10/29 07:06

投稿

Tera0724
Tera0724

スコア18

title CHANGED
File without changes
body CHANGED
@@ -3,4 +3,11 @@
3
3
  しかし、対処方法についてはpdf作成時の対処方法しか記入されていませんでした。プログラム側での対処方法はないのでしょうか。
4
4
  エンコードやデコードについて調べてみたのですが、現状わかっていない状況です。
5
5
  文章が下手で申し訳ありませんが、文字化けについて解決策があれば教えていただきたいです。
6
- 以上、よろしくお願いします。
6
+ 以上、よろしくお願いします。
7
+
8
+ <補足>
9
+ pyPDFに原因があると思っていましたが、その後の画像データ変換時の処理のどこかで文字化けしていることがわかりました。コードは以下の通りです。
10
+ pdfToImage = pdf2image.convert_from_path(pdfが保存されているパス)
11
+ imgArray = np.asarray(pdfToImage[0])
12
+ pdfImage = cv2.cvtColor(imgArray, cv2.COLOR_RGB2BGR)
13
+ cv2.imwrite("test.jpg", pdfImage)