Windows10 PC上のChrome、Google Colaboratory上でTabulaを利用したPDFからのデータフレームの取り出しを試みています。
Google Colaboratory上にあるサンプルファイル、ノート:tabula_example.ipynb
https://colab.research.google.com/github/chezou/tabula-py/blob/master/examples/tabula_example.ipynb
では以下のコードがきちんと動作するのですが、新たに自分自身で作成したノート上で実行すると
「AttributeError: module 'tabula' has no attribute 'read_pdf'」のエラーが出て動作しません。
同じコードはVisual Codeでも動かしており、Javaやライブラリの要件も満たしているようで、いろいろとググったのですがなぜこのエラーが出るのかが、わからない状態です。
もし、どなたか同様の症状に遭遇した方がいらっしゃいましたらご教授いただけると幸いです。
Python
1 2!java -version 3!pip install -q tabula-py 4import tabula 5 6pdf_path = "/content/Q-02342456.pdf" 7 8dfs = tabula.read_pdf(pdf_path, stream=True, pages='all') 9# read_pdf returns list of DataFrames 10print(len(dfs)) 11dfs 12
回答2件
あなたの回答
tips
プレビュー