以下のコードでpdfを読み込もうとしても、エラーが出てきます。
javaはインストールしたのですが、どこがいけないのかがわかりません。
どなたかご教示ください。
参考にしてみたネットの情報の一部
https://tutorialmore.com/questions-442689.htm
コードは以下の通りです。
import pandas as pd
import os
import tabula
os.chdir('d:/pdf/2')
os.path.exists('TEST20210805.pdf')
from tabula import read_pdf
df = read_pdf('TEST20210805.pdf',lattice=True,pages = '1')
なお、pdfは以下のような単純な表を罫線付きでエクセルで作ったものです。
氏名 身長
鈴木 163
田中 214
大橋 154
環境としては、anacondaをインストールし、jupyterで実行しています。
ネットで調べたのですが、path設定などの言葉を見つけ出し、探してみたのですが、
よくわかりませんでした。
FileNotFoundError Traceback (most recent call last)
C:\ProgramData\Anaconda3\lib\site-packages\tabula\io.py in _run(java_options, options, path, encoding)
79 try:
---> 80 result = subprocess.run(
81 args,
C:\ProgramData\Anaconda3\lib\subprocess.py in run(input, capture_output, timeout, check, *popenargs, **kwargs)
492
--> 493 with Popen(*popenargs, **kwargs) as process:
494 try:
C:\ProgramData\Anaconda3\lib\subprocess.py in init(self, args, bufsize, executable, stdin, stdout, stderr, preexec_fn, close_fds, shell, cwd, env, universal_newlines, startupinfo, creationflags, restore_signals, start_new_session, pass_fds, encoding, errors, text)
857
--> 858 self._execute_child(args, executable, preexec_fn, close_fds,
859 pass_fds, cwd, env,
C:\ProgramData\Anaconda3\lib\subprocess.py in _execute_child(self, args, executable, preexec_fn, close_fds, pass_fds, cwd, env, startupinfo, creationflags, shell, p2cread, p2cwrite, c2pread, c2pwrite, errread, errwrite, unused_restore_signals, unused_start_new_session)
1310 try:
-> 1311 hp, ht, pid, tid = _winapi.CreateProcess(executable, args,
1312 # no special security
FileNotFoundError: [WinError 2] 指定されたファイルが見つかりません。
During handling of the above exception, another exception occurred:
JavaNotFoundError Traceback (most recent call last)
<ipython-input-55-4dce2f256c39> in <module>
----> 1 df = read_pdf('TEST20210805.pdf',lattice=True,pages = '1')
C:\ProgramData\Anaconda3\lib\site-packages\tabula\io.py in read_pdf(input_path, output_format, encoding, java_options, pandas_options, multiple_tables, user_agent, **kwargs)
320
321 try:
--> 322 output = _run(java_options, kwargs, path, encoding)
323 finally:
324 if temporary:
C:\ProgramData\Anaconda3\lib\site-packages\tabula\io.py in _run(java_options, options, path, encoding)
89 return result.stdout
90 except FileNotFoundError:
---> 91 raise JavaNotFoundError(JAVA_NOT_FOUND_ERROR)
92 except subprocess.CalledProcessError as e:
93 logger.error("Error from tabula-java:\n{}\n".format(e.stderr.decode(encoding)))
JavaNotFoundError: java
command is not found from this Python process.Please ensure Java is installed and PATH is set for java
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2021/08/05 04:07