質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.46%
PDF

PDF(Portable Document Format)とはISOによって国際標準として制定されている電子ドキュメント用の拡張子です。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

1回答

4140閲覧

VScodeでpdf読み込み

saunawaterpool1

総合スコア4

PDF

PDF(Portable Document Format)とはISOによって国際標準として制定されている電子ドキュメント用の拡張子です。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

1クリップ

投稿2021/09/08 11:38

Pythonを使ってVScode上でpdfを読み込む事は可能でしょうか?
もし可能な場合、読み込んだ内容はターミナルに表示されるのでしょうか?
コンソールでしょうか?
初歩的な質問ですが教えて下さい

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

TakaiY

2021/09/08 12:56

たぶん、あなたのやりたいことにvscodeは関係ありません。 質問を書き換えて、やりたいことそのものについてと、「ネットではPythonを使ってる例があり、コード等丸写ししましたが上手くいきませんでした」の詳細を記述すれば良い回答が得られると思います。 また、この記事(https://fastclassinfo.com/entry/python_pdf_to_excel/)ま質問内容そのもののように見えますよ。
saunawaterpool1

2021/09/08 13:08

アドバイスありがとうございます。 VScodeでもこの記事と同じ事は可能という事ですね。試してみます。
TakaiY

2021/09/08 13:40

念の為書いておきますが「vscodeでPDFを読み込んでExcelに出力する」ことは基本的にできませんよ。 vscodeで書いた(まあ、何で書いても同じですが)pythonプログラムでPDFを読み込んでExcelに出力することはできます。また、そのプログラムをvscodeで起動することもできます(それをvscodeで読み混んだとは言いません)。
saunawaterpool1

2021/09/08 14:03

丁寧に教えて頂き、ありがとうございます。 色々と試してみます
guest

回答1

0

質問者のやりたいことがコメントから判明したので全面的に書き換え。

VSCodeを使うかどうかに関係なく、Pythonでpdfminer.sixモジュールをインポートすれば、テキスト情報を含むPDF文書からテキスト情報を取得できます。

Python

1from pdfminer.high_level import extract_text 2 3text = extract_text("XXXX.pdf") 4print(text)

printした結果がどこに表示されるかは、コードをどのように実行したかによります。VSCodeの統合ターミナルで実行すれば、その結果は統合ターミナルに表示されます。


まずは、あなた自身がワードなどから作成したPDF文書で試してみてください。それは確実にテキスト情報を含みます。

投稿2021/09/08 11:53

編集2021/09/08 14:32
Daregada

総合スコア11990

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

saunawaterpool1

2021/09/08 12:08

ありがとうございます。 最終目標はVScode上でpdfファイルを読み込み、excelに出力したいのですが可能でしょうか? ネットではPythonを使ってる例があり、コード等丸写ししましたが上手くいきませんでした。 VScodeでは不可能なのでしょうか?
Daregada

2021/09/08 12:21

他人にわかるように問題を説明しないと回答は得られません。 VSCodeでPDFファイルの何を読み込みたいのでしょうか。 Excelに出力したいのは何でしょうか。 たとえば、「PDFファイル中のテキストを取得して~」のように、やりたいことを他人にわかるように説明しましょう。
saunawaterpool1

2021/09/08 13:04

わかりにくい質問ですみません。 最終的にはVScodeでPDFのテキストを読み込んでエクセルに出力したいです。ですが、まずVScodeでpdfを読み込む練習として下記のURLにあるPythonのコード https://freeheroblog.com/pdfminer/ をそのままうつし、実行しましたがvscodeのコンソールにもターミナルにも何も出力されませんでした。 VScodeはpdfのテキストを抽出できないのでしょうか?
Daregada

2021/09/08 13:18

Pythonでpdfminer.sixを使えば、(VSCodeを使っているかどうかに関係なく)テキスト情報を含んでいるPDF文書からテキストを抜き出すことができます。 対象とするPDF文書が画像データなら、そのままではテキスト情報がないので、抜き出すことはできません。
saunawaterpool1

2021/09/08 14:02

丁寧に教えて頂き、ありがとうございます。 試してみます。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.46%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問