###前提・実現したいこと
python、php等でpdfのテキスト変換を行う際、特に下線等の抽出方法についてご存知の方がいたら教えて頂けませんでしょうか。
可能であればhtmlのように<u>タグで囲む等、どこからどこまでが下線有りなのか分かる状態が良いです。
###試したこと1
1.エクセルファイルで下線付きの文字列をPDF変換
2.python:pdfminerでテキスト抽出
結果:下線無し
###試したこと2
1.エクセルファイルで下線付きの文字列をPDF変換
2.PDF上で文字選択してエクセルに貼り付け
結果:下線無し
→ 下線はPDF変換した時にどんな扱いなのか益々不明に。

回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2018/01/10 01:01
2018/01/10 11:10
2018/01/11 00:36