質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.49%
Java EE

Java EE(Java Enterprise Edition)はJavaベースのテクノロジーとその相互運用の仕様をまとめたものです。サーバとクライアントのアーキテクチャを規定し、特定アプリケーションのクラス用に定義されたテクノロジー設定のプロファイルを使用します。

PDF

PDF(Portable Document Format)とはISOによって国際標準として制定されている電子ドキュメント用の拡張子です。

Q&A

0回答

1906閲覧

取り込んだPDFを編集し画面に表示するWebシステム

gegege

総合スコア15

Java EE

Java EE(Java Enterprise Edition)はJavaベースのテクノロジーとその相互運用の仕様をまとめたものです。サーバとクライアントのアーキテクチャを規定し、特定アプリケーションのクラス用に定義されたテクノロジー設定のプロファイルを使用します。

PDF

PDF(Portable Document Format)とはISOによって国際標準として制定されている電子ドキュメント用の拡張子です。

0グッド

3クリップ

投稿2016/01/16 13:37

編集2016/01/16 13:47

Java EEによるWebシステム開発初心者です。
曖昧性の高い質問になりますがよろしくお願い致します。

以下のような機能を持つWebシステムを構想しています。
実装方法についてアドバイスいただければと思い質問させていただきます。

  1. PDFを取り込む(ユーザがシステムにアップロード)
  2. PDF上の文字を読み取り,DBに持つ文字とマッチングを行う
  3. PDF上の文字のうちDBとマッチングした文字をハイライトし、画面上に表示

*ただしハイライトしてあること以外、元PDFと同じレイアウトで出力したい

イメージとしては、例えば以下のシステムです。
http://en.writecheck.com/
ユーザがアップロードした論文に対して、過去の論文との
類似度が高い部分をマークアップして出力するサービス
(取り込んだPDFに対しサーバー側の処理で情報を重ねて出力)

PDFを読み込むところまではiTextやPDFlib等でできる想定ですが
(A) PDF内の文の一部を編集(マークアップ)し、かつ
(B) 元のPDFのフォーマットを保持したまま出力する
アイディアが何かあれば教えていただけませんか。

(A)のみであれば元PDFからテキストを取得して編集すればよく、
(B)だけであればPDF形式や画像形式で取得したものをそのまま出力すれば
良いと思いますが、両立させる方法が思いつきません。

*なお出力時はPDF形式でなくとも、例えばXML形式での出力であっても
元のフォーマットが概ね保持できていれば問題ありません。

質問が曖昧で申し訳ありませんが、よろしくお願い致します。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだ回答がついていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.49%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問