スクレイピングを用いて、あるサイトからPDFのURLを取得し、それをリスト化するプログラムを作りたいです。
URLの取得まではできたのですが、その取得したURLをテキストファイルに保存しようとするとエラーが出てしまいます。
どなたか解決策のご教授お願いいたします。
コードとエラーは以下の通りです。
python
1コード 2base_url = "URL" 3html = request.urlopen(base_url) 4 5soup = BeautifulSoup(html,'html.parser') 6for i in soup.find_all('a'): 7 j = (urljoin(base_url, i.get('href'))) 8 print(j) 9 10 f = open('scraping.txt') 11 f.write(j) 12 f.close()
f.write(j) io.UnsupportedOperation: not writable
またエラーとは別の話なのですがこのプログラムをrunすると
javascript:window.close() javascript:void(0); javascript:void(0); javascript:void(0); javascript:void(0) PDFのURL PDFのURL javascript:void(0) PDFのURL javascript:window.close()
というような感じでjavascript~~というような文字列が出てきてしまいます。
この文字列を除いてPDFのURLのみを出力する方法があればお教えいただけるとありがたいです。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2018/07/09 04:06