マイコード
Python
1import requests 2url = 'https://www.u-tokyo.ac.jp/index_j.html' 3r = requests.get(url) 4r.text
アウトプットの一部
'<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">\r\n<html xmlns="http://www.w3.org/1999/xhtml" lang="ja" xml:lang="ja">\r\n<!-- Enable Cache 1418973001 : 1418973001 --><head>\r\n<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />\r\n<!--\r\n<meta http-equiv="Pragma" content="no-cache" />\r\n<meta http-equiv="Cache-Control" content="no-cache" />\r\n<meta http-equiv="Expires" content="Thu, 01 Dec 1994 16:00:00 GMT" />\r\n-->\r\n<meta http-equiv="Content-Script-Type" content="text/javascript" />\r\n<meta http-equiv="Content-Style-Type" content="text/css" />\r\n<meta name="description" content="æ\x9d±äº¬å¤§å\xad¦ã\x81®ã\x82ªã\x83\x95ã\x82£ã\x82·ã\x83£ã\x83«ã\x82µã\x82¤ã\x83\x88ã\x81§ã\x81\x99ã\x80\x82大å\xad¦æ¡\x88å\x86\x85ã\x80\x81å\xad¦é\x83¨ã\x83»å¤§å\xad¦é\x99¢ç\xad\x89ã\x81®ç´¹ä»\x8bã\x80\x81ç\xa0\x94究活å\x8b\x95ã\x83»å\x9b½é\x9a\x9bæ´»å\x8b\x95ã\x80\x81å\x85¥å\xad¦æ¡\x88å\x86\x85ç\xad\x89ã\x80\x81æ\x9d±äº¬å¤§å\xad¦ã\x81®æ\x83\x85å\xa0±ã\x82\x92ã\x81\x94覧ã\x81\x84ã\x81\x9fã\x81\xa0ã\x81\x91ã\x81¾ã\x81\x99ã\x80\x82" />\r\n<meta
この出力をメモ帳にコピーしてブラウザで開いても、明らかにうまくいっていないことがわかります。何がいけないのでしょう?
ページを開くと、\r\nとか\tとかがたくさんあります。「æ\x95\x99å\x93¡æ¤」とか文字化けみたいな感じになってます。
追記:やろうとしてることがわからないという質問があったので
与えられたURLにGETリクエストでHTMLを取得して、それをブラウザで表示するという試みです。
回答2件
あなたの回答
tips
プレビュー