前提・実現したいこと
Pythonでのスクレイピングの学習を始めて1週間程のものです。
管理者から了解を得て業務として社内Webサイトのtableデータを加工して業務改善を図ろうとしています。
まずは認証が上手くいくか試すためにBeautiful Soupでtitleのテキストを取得を試みています。
発生している問題・エラーメッセージ
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd"> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1"/> <title>401 - Unauthorized: Access is denied due to invalid credentials.</title> <style type="text/css"> <!-- body{margin:0;font-size:.7em;font-family:Verdana, Arial, Helvetica, sans-serif;background:#EEEEEE;} fieldset{padding:0 15px 10px 15px;} h1{font-size:2.4em;margin:0;color:#FFF;} h2{font-size:1.7em;margin:0;color:#CC0000;} h3{font-size:1.2em;margin:10px 0 0 0;color:#000000;} #header{width:96%;margin:0 0 0 0;padding:6px 2% 6px 2%;font-family:"trebuchet MS", Verdana, sans-serif;color:#FFF; background-color:#555555;} #content{margin:0 0 0 2%;position:relative;} .content-container{background:#FFF;width:96%;margin-top:8px;padding:10px;position:relative;} --> </style> </head> <body> <div id="header"><h1>Server Error</h1></div> <div id="content"> <div class="content-container"><fieldset> <h2>401 - Unauthorized: Access is denied due to invalid credentials.</h2> <h3>You do not have permission to view this directory or page using the credentials that you supplied.</h3> </fieldset></div> </div> </body> </html>
該当のソースコード
import requests
from bs4 import BeautifulSoup
from requests.auth import HTTPBasicAuth
url = "http:/*********"
user_agent = "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.101 Safari/537.36"
headers = {"User-Agent": user_agent}
session = requests.session()
r = session.get(url,auth=HTTPBasicAuth("account", "pass"),headers=headers)
key = {"ASP.NET_SessionId" : "value"}
s = r.cookies
requests.post(url, data=key,cookies=s)
soup = BeautifulSoup(r.content,"html.parser")
title = soup.find("td", attrs={"class":"title"})
print(title)
試したこと
Fiddler4を使用し、ResponseのcookieにASP.NET_SessionIdとChromeのDeveloper ToolsのNetworkからasxファイルを確認しました。
ネットでASP.NET_SessionIdの取得方法はあるのですが、値を与えてログインする方法が見当たらなく手詰まりの状態です。
足らない情報等あると思いますがすぐに対応させて頂きますのでよろしくお願いします。
補足情報(FW/ツールのバージョンなど)
回答1件
あなたの回答
tips
プレビュー