回答編集履歴
5
誤字を修正
test
CHANGED
@@ -2,7 +2,7 @@
|
|
2
2
|
|
3
3
|
|
4
4
|
|
5
|
-
VSCodeを使うかどうかに関係なく、Pythonでpdfmin
|
5
|
+
VSCodeを使うかどうかに関係なく、Pythonでpdfminer.sixモジュールをインポートすれば、テキスト情報を含むPDF文書からテキスト情報を取得できます。
|
6
6
|
|
7
7
|
|
8
8
|
|
4
補足を追加
test
CHANGED
@@ -21,3 +21,9 @@
|
|
21
21
|
|
22
22
|
|
23
23
|
`print`した結果がどこに表示されるかは、コードをどのように実行したかによります。VSCodeの統合ターミナルで実行すれば、その結果は統合ターミナルに表示されます。
|
24
|
+
|
25
|
+
|
26
|
+
|
27
|
+
---
|
28
|
+
|
29
|
+
まずは、あなた自身がワードなどから作成したPDF文書で試してみてください。それは確実にテキスト情報を含みます。
|
3
誤字を修正
test
CHANGED
@@ -1,4 +1,4 @@
|
|
1
|
-
質問者のやりたいことがコメントから判明したので
|
1
|
+
質問者のやりたいことがコメントから判明したので全面的に書き換え。
|
2
2
|
|
3
3
|
|
4
4
|
|
2
コメントから判明した質問に応じて修正
test
CHANGED
@@ -1,13 +1,23 @@
|
|
1
|
-
|
1
|
+
質問者のやりたいことがコメントから判明したので前面書き換え。
|
2
2
|
|
3
3
|
|
4
4
|
|
5
|
-
P
|
5
|
+
VSCodeを使うかどうかに関係なく、Pythonでpdfminor.sixモジュールをインポートすれば、テキスト情報を含むPDF文書からテキスト情報を取得できます。
|
6
6
|
|
7
7
|
|
8
8
|
|
9
|
+
```Python
|
10
|
+
|
9
|
-
|
11
|
+
from pdfminer.high_level import extract_text
|
10
12
|
|
11
13
|
|
12
14
|
|
15
|
+
text = extract_text("XXXX.pdf")
|
16
|
+
|
17
|
+
print(text)
|
18
|
+
|
19
|
+
```
|
20
|
+
|
21
|
+
|
22
|
+
|
13
|
-
|
23
|
+
`print`した結果がどこに表示されるかは、コードをどのように実行したかによります。VSCodeの統合ターミナルで実行すれば、その結果は統合ターミナルに表示されます。
|
1
補足を追加
test
CHANGED
@@ -1,4 +1,4 @@
|
|
1
|
-
PDF文書をビューアー(Acrobat Readerなど)で見るように、VSCodeの内部で表示したいということであれば、拡張機能でPDF形式に対応したビューアーを入れれば表示できます。
|
1
|
+
PDF文書をビューアー(Acrobat Readerなど)で見るように、VSCodeの内部で表示したいということであれば、拡張機能でPDF形式に対応したビューアーを入れれば表示できます。表示されるのは、エディターペイン(ファイルの内容が表示される場所)です。
|
2
2
|
|
3
3
|
|
4
4
|
|