Python 3.4 です。requests.get()に、PDFファイルにリンクしているurlを渡し、それをローカルに保存しようとしても空PDFになってしまいます。
なお、PDFの中身は日本語で、文字とテーブルが混ざったような数ページ物です。以下にコードを示しており、具体的なurlも載せています(これをブラウザに入れるとPDFは正しく表示されるのですが・・)、もし解決方法や原因が分かる方がいらしたらぜひご教示ください。なお、環境はWindows10です。よろしくおねがいします。
###該当のソースコード
# coding: utf-8 import requests import json import os import numpy as np import pandas as pd import datetime as dt path = "C:/Users/_Data/out.pdf" url = 'https://webapi.yanoshin.jp/rde.php?https%3A%2F%2Fdisclosure.edinet-fsa.go.jp%2FE01EW%2Fdownload%3Fuji.verb%3DW0EZA104CXP002002BLogic%26uji.bean%3Dee.bean.parent.EECommonSearchBean%26s%3DS100AYP8' req = requests.get(url) myfile = open(path, "wb") myfile.write(req.content) pdf = open(path, "rb")
###PDFを開こうとするとAdobe Acrobat上で表示されるエラーメッセージ
"Adobe Acrobat Reader DC could not open 'out.pdf' because it is either not a supported file type or because the file has been damaged (for example, it was sent as an email attachment and wasn't correctly decoded)"
###すでに試したこと
・ファイル作成時に"wb"でなく"w"でも一応やってみましたが、ワークせず
・一応、import urllib で urllib.request.urlopen() も試しましたがワークせず

回答1件
あなたの回答
tips
プレビュー
下記のような回答は推奨されていません。
このような回答には修正を依頼しましょう。
また依頼した内容が修正された場合は、修正依頼を取り消すようにしましょう。
2017/08/15 03:04
2017/08/15 03:25