質問編集履歴

誤字修正

2023/05/01 06:12

投稿

zy70

スコア4

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -8,35 +8,31 @@
 テキストの文字が1ブロックになっている場合（表現が適切か分かりませんが）は読み取れますが、
 複数に分かれている場合に出力できません。(文末に補足の画像を掲載しました）
-### 該当のソースコード
+```ここに言語を入力
-python
-ソースコード
+コード
 from pdfminer.high_level import extract_text
 from pdfminer.layout import LAParams, LTTextBoxHorizontal, LTTextLineHorizontal
 from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter
 from pdfminer.pdfpage import PDFPage
 from pdfminer.converter import PDFPageAggregator
-# 範囲を指定
-# x1, y1, x2, y2 = 100, 100, 200, 200 #座標
-# PDFファイルを開く
+x1, y1, x2, y2 = 100,100,200,200 #範囲を指定
-with open('/example.pdf', 'rb') as pdf_file:
+with open('/rename/image.pdf', 'rb') as pdf_file: # PDFファイルを開く
-    # PDFMinerのリソースマネージャーを初期化
-    resource_manager = PDFResourceManager()
+    resource_manager = PDFResourceManager()     # PDFMinerのリソースマネージャーを初期化
     laparams = LAParams()
     device = PDFPageAggregator(resource_manager, laparams=laparams)
     interpreter = PDFPageInterpreter(resource_manager, device)
-    # ページごとに処理
-    for page in PDFPage.get_pages(pdf_file):
+    for page in PDFPage.get_pages(pdf_file):     # ページごとに処理
         interpreter.process_page(page)
         layout = device.get_result()
-        # ページ内のテキストをチェック
-        for lt_obj in layout:
+        for lt_obj in layout:         # ページ内のテキストをチェック
             if isinstance(lt_obj, (LTTextBoxHorizontal, LTTextLineHorizontal)):
                 x, y, _, _ = lt_obj.bbox
                 if x1 <= x <= x2 and y1 <= y <= y2:
@@ -44,8 +40,13 @@
                     print(text)
 ### 試したこと
+検出された複数のテキストに対して、OCRさせたい両端の座標を入力すればよいのではないかと想定して試しましたが、
+結果はダメでした。(補足情報欄にイメージを掲載しました)
-pdf内のテキストの座標は、以下のコードを実行して取得しました。
+なお、pdf内のテキストの座標は、以下のコードを実行して取得しました。
 python
 コード
@@ -57,10 +58,8 @@
 from pdfminer.pdfinterp import PDFPageInterpreter
 from pdfminer.layout import LAParams
 from pdfminer.converter import PDFPageAggregator
-![イメージ説明](https://ddjkaamml8q8x.cloudfront.net/questions/2023-05-01/75e1984c-6597-486d-aa8f-38623fad0395.png)
 # PDFファイルのパスを指定
-# pdf_file_path = "/rename/simple1.pdf"
-pdf_file_path = "/rename/example.pdf"
+pdf_file_path = "/image.pdf"
 # PDFファイルをバイナリ形式で開く
 with open(pdf_file_path, 'rb') as fp:
@@ -90,8 +89,4 @@
             if hasattr(element, "get_text"):
                 print("Text: ", element.get_text())
                 print("Position: ", element.bbox)
-### 補足情報（FW/ツールのバージョンなど）
-![イメージ説明](https://ddjkaamml8q8x.cloudfront.net/questions/2023-05-01/fe575e47-f472-478e-956b-12a53435808e.png)
+![イメージ説明](https://ddjkaamml8q8x.cloudfront.net/questions/2023-05-01/54c27e34-4305-406e-9f76-2a352685d139.png)

Python