質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.03%

iTextでHTMLをPDF化する際に<HR>タグが入るとエラーとなる

解決済

回答 2

投稿 編集

  • 評価
  • クリップ 0
  • VIEW 68

Yuu-.

score 0

iText5.5.13.1を使用し、HTMLファイルをPDF化しようとしています。
以下のようなテスト用のHTMLを使用し、PDFへ変換処理を実行しましたが、HTMLWorker.parseToListの箇所でjava.lang.NullPointerExceptionがスローされました。
しかし、<HR>タグを除去すると正常にPDFが出力されるため、<HR>タグが原因というところまではわかりましたが、解決策が見つけられない状況です。
様々な資料を検索していましたが、<HR>タグ対応はiText2系のバージョンで対応済であるという記述を見つけており、対応はしていると考えています。
対応策について知識のある方の意見をお聞きしたいです。

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html lang="ja">
<body>
<h1>testてすと</h1>
<hr>
<h1>testてすと</h1>
</body>
</html>
public class Test {
    private static final float MARGIN_SIZE = 60;

    public static void main(String[] args) throws Exception {

        BufferedReader br = new BufferedReader(new InputStreamReader(new FileInputStream("test.html")));
        StringBuilder sb = new StringBuilder();

        String line;
        while ((line = br.readLine()) != null) {
            sb.append(line);
        }

        HashMap<String, Object> prov = new HashMap<String, Object>();
        prov.put(HTMLWorker.FONT_PROVIDER, new TextFontProvider());

        OutputStream file = new FileOutputStream(new File("output.pdf"));
        Document doc = new Document(PageSize.A4, 30, 30, 30, 30);
        PdfWriter.getInstance(doc, file);
        doc.open();

        HTMLWorker wkr = new HTMLWorker(doc);
        wkr.setProviders(prov);

        List<Element> list = HTMLWorker.parseToList(
                new StringReader(sb.toString()),
                null, prov);
        for (Element e : list) {
            doc.add(e);
        }
        doc.close();
        file.close();
    }

}
public class TextFontProvider implements FontProvider {
    /** フォントサイズ  */
    private static final float FONT_SIZE = 10.5f;

    /**
     * コンストラクタ
     */
    public TextFontProvider() {
    }

    @Override
    public Font getFont(String fontname, String encoding, boolean embedded,
            float size, int style, BaseColor color) {
        Font font = null;
        try {
            font = new Font(BaseFont.createFont("KozMinPro-Regular", "UniJIS-UCS2-H",
                    BaseFont.NOT_EMBEDDED), FONT_SIZE, style, color);
        } catch (Exception e) {
            e.printStackTrace();
        }

        return font;
    }

    @Override
    public boolean isRegistered(String fontname) {
        return false;
    }
}

・スローされた例外の全文は以下になります。

Exception in thread "main" java.lang.NullPointerException
    at com.itextpdf.text.html.simpleparser.HTMLWorker.createLineSeparator(HTMLWorker.java:445)
    at com.itextpdf.text.html.simpleparser.HTMLTagProcessors$5.startElement(HTMLTagProcessors.java:208)
    at com.itextpdf.text.html.simpleparser.HTMLWorker.startElement(HTMLWorker.java:199)
    at com.itextpdf.text.xml.simpleparser.SimpleXMLParser.processTag(SimpleXMLParser.java:581)
    at com.itextpdf.text.xml.simpleparser.SimpleXMLParser.go(SimpleXMLParser.java:299)
    at com.itextpdf.text.xml.simpleparser.SimpleXMLParser.parse(SimpleXMLParser.java:607)
    at com.itextpdf.text.html.simpleparser.HTMLWorker.parse(HTMLWorker.java:153)
    at com.itextpdf.text.html.simpleparser.HTMLWorker.parseToList(HTMLWorker.java:828)
    at com.itextpdf.text.html.simpleparser.HTMLWorker.parseToList(HTMLWorker.java:809)
    at test.Test.main(Test.java:44)
  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

質問への追記・修正、ベストアンサー選択の依頼

  • Yuu-.

    2019/11/08 22:29 編集

    確認したところHTML5で記述しても同様の例外がスローされました。

    キャンセル

  • m.ts10806

    2019/11/08 22:33

    XML形式だと閉じタグがいるかもしれません。
    <hr />
    上記で試してみてください。

    キャンセル

  • Yuu-.

    2019/11/08 23:07 編集

    m.ts10806様
    hrタグに閉じタグを加えてみたのですが、同様の例外がスローされてしまいました。

    キャンセル

回答 2

checkベストアンサー

0

HTMLWorker も調べましたが, どうもバグのような気がする動作になっていました.
HTMLWorker は非推奨ですし, XMLWorker をご利用になったほうが良いように思います.
フォントの指定方法は調べていないのですが, XMLWorker(Helper) を使用すると <hr/> でエラー無く変換されました.

package teratail.q221953;

import java.io.File;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.InputStream;
import java.io.OutputStream;

import com.itextpdf.text.Document;
import com.itextpdf.text.PageSize;
import com.itextpdf.text.pdf.PdfWriter;
import com.itextpdf.tool.xml.XMLWorkerHelper;

public class Test {
  public static void main(String[] args) throws Exception {
    InputStream is = new FileInputStream("test.html");
    OutputStream file = new FileOutputStream(new File("output.pdf"));
    Document doc = new Document(PageSize.A4, 30, 30, 30, 30);
    PdfWriter writer = PdfWriter.getInstance(doc, file);
    doc.open();

    XMLWorkerHelper.getInstance().parseXHtml(writer, doc, is);

    doc.close();
    file.close();
    is.close();
  }
}

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2019/11/09 14:54

    調べていただきありがとうございます。XMLWorkerを使う方向で検討してみます。フォントを指定しないと日本語での出力ができないので悩ましいところでありますが...

    キャンセル

0

皆さまからの回答をいただき、最終的に以下のコードでXMLWorkerを使用し、日本語でのPDF出力まで実現できました。
お力添えいただき、ありがとうございました。

public class Test2 {

    @SuppressWarnings("deprecation")
    public static void main(String[] args) throws Exception {

        BufferedReader br = new BufferedReader(new InputStreamReader(new FileInputStream("file/test.html")));
        StringBuilder sb = new StringBuilder();

        String line;
        while ((line = br.readLine()) != null) {
            sb.append(line);
        }

        OutputStream file = new FileOutputStream(new File("file/output2.pdf"));
        Document doc = new Document(PageSize.A4, 30, 30, 30, 30);
        PdfWriter writer = PdfWriter.getInstance(doc, file);

        XMLWorkerHelper wkr = XMLWorkerHelper.getInstance();

        doc.open();
        wkr.parseXHtml(writer, doc,
                new ByteArrayInputStream(sb.toString().getBytes("UTF-8")),
                Charset.forName("UTF-8"), new TextFontProvider());

        doc.close();
        file.close();
    }

}
public class TextFontProvider extends XMLWorkerFontProvider {
    /** フォントサイズ  */
    private static final float FONT_SIZE = 10.5f;

    /**
     * コンストラクタ
     */
    public TextFontProvider() {
    }

    public Font getFont(String fontname, String encoding, boolean embedded,
            float size, int style, BaseColor color) {
        Font font = null;
        try {
            font = new Font(BaseFont.createFont("KozMinPro-Regular", "UniJIS-UCS2-H",
                    BaseFont.NOT_EMBEDDED), FONT_SIZE, style, color);
        } catch (Exception e) {
            e.printStackTrace();
        }

        return font;
    }

    public boolean isRegistered(String fontname) {
        return false;
    }
}

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 90.03%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる