例えば以下のような見開きが1ページとなっているようなPDFをpythonのPDFminerでテキストマイニングしようとすると、
図の赤線のように別のページにわたって1文のように認識されてしまいます。
これをうまく回避する方法はありませんか?
よろしくお願いいたします。
https://www.naruto-u.ac.jp/center/celees/en/activitybook/pdf/activity_2.pdf
投稿2021/02/16 11:54
例えば以下のような見開きが1ページとなっているようなPDFをpythonのPDFminerでテキストマイニングしようとすると、
図の赤線のように別のページにわたって1文のように認識されてしまいます。
これをうまく回避する方法はありませんか?
よろしくお願いいたします。
https://www.naruto-u.ac.jp/center/celees/en/activitybook/pdf/activity_2.pdf
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2021/02/17 06:42
2021/02/19 02:59