質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.38%

  • Python

    12839questions

    Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

python エラーの原因がわかりません。初心者です。

解決済

回答 1

投稿 編集

  • 評価
  • クリップ 2
  • VIEW 258

前提・実現したいこと

python初心者で勉強中です。
購入した本の例文をそのまま打ち込んだのですがエラーになりうまく動きません。
エラーの原因を教えていただきたいです。

内容はカレントディレクトリにあるPDFを合体させるもののようです。

PDFの名前以外は本に書いてあるそのまま打ち込みました。
初心者で知識がないので説明不十分かもしれませんが、よろしくお願いいたします。
Python 3.7.3 
Windows7
----追記
結合用に用意しているPDFをtestpdfとだけ入力されているものにしたら、エラーが別のものに変わりました。(当初は写真が添付されてたり表などがあった)
でも結局うまく作動しないので原因を教えていただけると助かります。

発生している問題・エラーメッセージ

------PDFを変えた後のエラー
UnicodeEncodeError: 'ascii' codec can't encode characters in position 24-25: ordinal not in range(128)



------PDFを変える前のエラー
PdfReadError("Illegal character in Name Object")

    write C:\Users\userid\AppData\Local\Programs\Python\Python37\Lib\site-packages\PyPDF2\pdf.py 482
    _sweepIndirectReferences C:\Users\userid\AppData\Local\Programs\Python\Python37\Lib\site-packages\PyPDF2\pdf.py 571
    _sweepIndirectReferences C:\Users\userid\AppData\Local\Programs\Python\Python37\Lib\site-packages\PyPDF2\pdf.py 547
    _sweepIndirectReferences C:\Users\userid\AppData\Local\Programs\Python\Python37\Lib\site-packages\PyPDF2\pdf.py 571
    _sweepIndirectReferences C:\Users\userid\AppData\Local\Programs\Python\Python37\Lib\site-packages\PyPDF2\pdf.py 547
    _sweepIndirectReferences C:\Users\userid\AppData\Local\Programs\Python\Python37\Lib\site-packages\PyPDF2\pdf.py 556
    _sweepIndirectReferences C:\Users\userid\AppData\Local\Programs\Python\Python37\Lib\site-packages\PyPDF2\pdf.py 571
    _sweepIndirectReferences C:\Users\userid\AppData\Local\Programs\Python\Python37\Lib\site-packages\PyPDF2\pdf.py 547
    _sweepIndirectReferences C:\Users\userid\AppData\Local\Programs\Python\Python37\Lib\site-packages\PyPDF2\pdf.py 547
    _sweepIndirectReferences C:\Users\userid\AppData\Local\Programs\Python\Python37\Lib\site-packages\PyPDF2\pdf.py 547
    _sweepIndirectReferences C:\Users\userid\AppData\Local\Programs\Python\Python37\Lib\site-packages\PyPDF2\pdf.py 577
    getObject C:\Users\userid\AppData\Local\Programs\Python\Python37\Lib\site-packages\PyPDF2\pdf.py 1611
    readObject C:\Users\userid\AppData\Local\Programs\Python\Python37\Lib\site-packages\PyPDF2\generic.py 66
    readFromStream C:\Users\userid\AppData\Local\Programs\Python\Python37\Lib\site-packages\PyPDF2\generic.py 579
    readObject C:\Users\userid\AppData\Local\Programs\Python\Python37\Lib\site-packages\PyPDF2\generic.py 60
    readFromStream C:\Users\userid\AppData\Local\Programs\Python\Python37\Lib\site-packages\PyPDF2\generic.py 492
PdfReadError: Illegal character in Name Object  

該当のソースコード

import PyPDF2
pdf1_file = open('test1.pdf','rb')
pdf2_file = open('test2.pdf','rb')
pdf1_reader = PyPDF2.PdfFileReader(pdf1_file)
pdf2_reader = PyPDF2.PdfFileReader(pdf2_file)
pdf_writer = PyPDF2.PdfFileWriter()
for page_num in range(pdf1_reader.numPages):
    page_obj = pdf2_reader.getPage(page_num)
    pdf_writer.addPage(page_obj)
for page_num in range(pdf2_reader.numPages):
    page_obj =pdf2_reader.getPage(page_num)
    pdf_writer.addPage(page_obj)


pdf_output_file =open('newdata.pdf','wb')
pdf_writer.write(pdf_output_file)
pdf_output_file.close()
pdf2_file.close()
pdf1_file.close()

試したこと

エラーメッセージを検索しましたがよくわかりませんでした。

補足情報(FW/ツールのバージョンなど)

Python 3.7.3
Windows7

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

質問への追記・修正、ベストアンサー選択の依頼

  • quiqui

    2019/06/05 11:57 編集

    エラーメッセージはスタックトレースも含めて全部書きましょう。どこで出たエラーなのかすら回答者側にわからなくなっています。 "自分で解釈・要約しようとしてはいけません" https://teratail.com/help/question-tips#questionTips3-4-2

    キャンセル

  • 退会済みユーザー

    退会済みユーザー

    2019/06/05 12:15

    初心者なら初心者マークをつけましょう

    キャンセル

  • dokidoki_hamuo

    2019/06/05 12:55

    すみません、はじめて投稿したのでやり方がわからなかったので初心者マークをつけられることを知りませんでした。今つけてみました。

    キャンセル

  • dokidoki_hamuo

    2019/06/05 13:14

    エラーについて、今後ご指摘いただいた通りに記載します。勉強になりました。ありがとうございます。

    キャンセル

回答 1

checkベストアンサー

+1

githubによると、エラーの原因となるソースは以下の部分です。

#485~494行目
        try:
            return NameObject(name.decode('utf-8'))
        except (UnicodeEncodeError, UnicodeDecodeError) as e:
            # Name objects should represent irregular characters
            # with a '#' followed by the symbol's hex number
            if not pdf.strict:
                warnings.warn("Illegal character in Name Object", utils.PdfReadWarning)
                return NameObject(name)
            else:
                raise utils.PdfReadError("Illegal character in Name Object")

pdf.strictのフラグによってエラーとするか警告とするか変えられるので、読み込む前に各pdfオブジェクトのstrict属性をFalseにすれば、エラーを起こさず実行できると思います。

本来エラーとなる部分を警告扱いとして無視する形になるので、微妙な解決法ではありますが…

pdf1_file = open('test1.pdf','rb')
pdf2_file = open('test2.pdf','rb')

#追加部分
pdf1_file.strict=False
pdf2_file.strict=False

pdf1_reader = PyPDF2.PdfFileReader(pdf1_file)
pdf2_reader = PyPDF2.PdfFileReader(pdf2_file)

ただ、根本的な原因はUnicodeEncodeError, UnicodeDecodeErrorの部分なので、そこを解消しないと、仮に読み込めても所望の結果が得られないかもしれません。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2019/06/06 09:51

    ありがとうございます!!ちゃんと作動し、PDFも合体されていました。感激です!!

    根本的な原因はUnicodeEncodeError, UnicodeDecodeErrorとのことですが、ネットで調べてみた例として
    foo ( str );

    foo ( str.decode('utf-8') );
    に直す、というようなことが記載されていました。

    該当するコードはどの部分であるか、教えていただくことは可能でしょうか。
    見当違いな質問でしたらすみません。

    キャンセル

  • 2019/06/06 11:05

    回答内のソースにreturn NameObject(name.decode('utf-8'))とあるので、多分質問者さんが考えてる方法はすでに行われていますね。しかもその過程で問題のUnicodeDecodeErrorが発生してるので、その解決策は微妙だと思います。

    エンコードについてそこまで語れるわけじゃないので断言はできませんが、以下の記事など試してみるといいかもしれません。
    http://shu223.hatenablog.com/entry/20111201/1328334689

    キャンセル

  • 2019/06/06 11:44

    ご丁寧にありがとうございました!また何かありましたらよろしくお願いいたします。

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 90.38%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

同じタグがついた質問を見る

  • Python

    12839questions

    Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。