PythonでPDFをスクレイピング
表題の通り、pythonでPDFをスクレイピングし、URLを取得したいのですが、実行するものの、
出力がされません。
どなたかご教授ください!
取得したいURLは以下のPDFです
https://www.caa.go.jp/policies/policy/consumer_policy/caution/internet/pdf/20140228adjustments_1.pdf
コードは以下の通りです。
import csv import request from urllib.parse import urljoin from bs4 import BeautifulSoup import ssl base_url = "https://www.caa.go.jp/policies/policy/consumer_policy/caution/internet/assets/consumer_policy_cms105_201030_01.pdf" html = request.urlopen(base_url) soup = BeautifulSoup(html,'html.parser') soup = BeautifulSoup(html,'html.parser') for i in soup.find_all('a'): j = (urljoin(base_url, i.get('href'))) print(j) f = open('scraping.txt', mode='w') f.write(j) f.close()