質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

88.59%

urllib.requestで拾ってきたファイルが中身が違う

解決済

回答 2

投稿 編集

  • 評価
  • クリップ 0
  • VIEW 345

chgrios

score 50

f2 = request.urlopen([ターゲットのurl])
    html2 = f2.read()
    soup2 = BeautifulSoup(html2,'html.parser')
   print(soup2)

このようなpythonコードで抽出したHTMLソースコード(print(soup2)部分)が「該当URLをブラウザで開いてsave as で保存したソース」と違っていました。
どのようにしたら「該当URLをブラウザで開いてsave as で保存したソース」を抽出できますか?

抽出したが中身は違っていたソースコード↓

<!DOCTYPE doctype html>
<html lang="en"><head><meta charset="utf-8"/><link href="/favicon.ico" rel="shortcut icon"/><meta content="width=device-width,initial-scale=1,shrink-to-fit=no" name="viewport"/><meta content="#000000" name="theme-color"/><link href="/manifest.json" rel="manifest"/><title>TFTACTICS.GG - Teamfight Tactics Database, Item Builder, Team Builder</title><script>!function(t,a){if(function(e){"string"==typeof e&&(e=[e]);for(var n=0;n<e.length;n++)a.cookie=e[n]+"=;max-age=-1;domain=."+a.domain+";path=/"}(["euconsent","eupubconsent","googlepersonalization"]),!t.__cmp){t.__cmp=function(){(t.attachEvent||t.addEventListener)("message",function(e){t.__cmp.receiveMessage(e)},!1),function e(){if(!t.frames.__cmpLocator)if(a.body){var n=a.createElement("iframe");n.style.display="none",n.name="__cmpLocator",a.body.appendChild(n)}else setTimeout(e,5)}();var o=[],e=function(e,n,a){"ping"===e?a&&a({gdprAppliesGlobally:!!(t.__cmp&&t.__cmp.config&&t.__cmp.config.storeConsentGlobally),cmpLoaded:!1}):o.push({command:e,parameter:n,callback:a})};return e.commandQueue=o,e.receiveMessage=function(e){var n=e&&e.data&&e.data.__cmpCall;n&&o.push({callId:n.callId,command:n.command,parameter:n.parameter,event:e})},e.config=t.cmpConfig||{globalVendorListLocation:"https://cmp.network-n.com/vendorlist.json"},e}();var e=a.createElement("script");e.async=!0,e.src="https://cmp.network-n.com/js/cmp.complete.bundle.js",a.getElementsByTagName("head")[0].appendChild(e)}}(window,document)</script><script async="" src="https://www.googletagmanager.com/gtag/js?id=UA-61167242-4"></script><script>function gtag(){dataLayer.push(arguments)}window.dataLayer=window.dataLayer||[],gtag("js",new Date),gtag("config","UA-61167242-6")</script><script>!function(o,n){function t(){var o,c,e;_localCS.loaded||(_comscore.push({c1:"2",c2:"25110922",cs_ucfr:_localCS.consent}),c=(o=n).createElement("script"),e=o.getElementsByTagName("script")[0],c.async=!0,c.src=("https:"==o.location.protocol?"https://sb":"http://b")+".scorecardresearch.com/beacon.js",e.parentNode.insertBefore(c,e),_localCS.loaded=!0)}o._localCS={consent:null,loaded:!1,tx:null},o._comscore=o._comscore||[],o.__cmp&&(o.__cmp("getVendorConsents",[77],function(o,c){function e(o){return"object"==typeof o}c&&(_localCS.consent=e(o)&&e(o.vendorConsents)&&o.vendorConsents[77],_localCS.consent=_localCS.consent?"1":"0",t())}),function c(){o.__cmp("ping",null,function(o){if(!1===o.cmpLoaded){if(null===_localCS.tx)return void(_localCS.tx=setTimeout(c,3e3));t()}o.cmpLoaded&&(clearTimeout(_localCS.tx),t())})}()),o.__cmp||t()}(window,document)</script><noscript><img src="https://sb.scorecardresearch.com/p?c1=2&amp;c2=25110922&amp;cv=2.0&amp;cj=1"/></noscript><script src="/tftactics.min.js"></script><script async="" src="//tag.escalated.io?i=dnBYRYjwu3atX"></script><link href="/static/css/2.88f38d9b.chunk.css" rel="stylesheet"/><link href="/static/css/main.5a3d682d.chunk.css" rel="stylesheet"/></head><body><noscript>You need to enable JavaScript to run this app.</noscript><div id="root"></div><script>!function(f){function e(e){for(var r,t,n=e[0],o=e[1],u=e[2],l=0,a=[];l<n.length;l++)t=n[l],Object.prototype.hasOwnProperty.call(c,t)&&c[t]&&a.push(c[t][0]),c[t]=0;for(r in o)Object.prototype.hasOwnProperty.call(o,r)&&(f[r]=o[r]);for(s&&s(e);a.length;)a.shift()();return p.push.apply(p,u||[]),i()}function i(){for(var e,r=0;r<p.length;r++){for(var t=p[r],n=!0,o=1;o<t.length;o++){var u=t[o];0!==c[u]&&(n=!1)}n&&(p.splice(r--,1),e=l(l.s=t[0]))}return e}var t={},c={1:0},p=[];function l(e){if(t[e])return t[e].exports;var r=t[e]={i:e,l:!1,exports:{}};return f[e].call(r.exports,r,r.exports,l),r.l=!0,r.exports}l.m=f,l.c=t,l.d=function(e,r,t){l.o(e,r)||Object.defineProperty(e,r,{enumerable:!0,get:t})},l.r=function(e){"undefined"!=typeof Symbol&&Symbol.toStringTag&&Object.defineProperty(e,Symbol.toStringTag,{value:"Module"}),Object.defineProperty(e,"__esModule",{value:!0})},l.t=function(r,e){if(1&e&&(r=l(r)),8&e)return r;if(4&e&&"object"==typeof r&&r&&r.__esModule)return r;var t=Object.create(null);if(l.r(t),Object.defineProperty(t,"default",{enumerable:!0,value:r}),2&e&&"string"!=typeof r)for(var n in r)l.d(t,n,function(e){return r[e]}.bind(null,n));return t},l.n=function(e){var r=e&&e.__esModule?function(){return e.default}:function(){return e};return l.d(r,"a",r),r},l.o=function(e,r){return Object.prototype.hasOwnProperty.call(e,r)},l.p="/";var r=this.webpackJsonpwestmarch=this.webpackJsonpwestmarch||[],n=r.push.bind(r);r.push=e,r=r.slice();for(var o=0;o<r.length;o++)e(r[o]);var s=n;i()}([])</script><script src="/static/js/2.da7cb3d7.chunk.js"></script><script src="/static/js/main.7fe4104d.chunk.js"></script></body></html>

本家のurl↓

https://tftactics.gg/champions/aatrox

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 過去に投稿した質問と同じ内容の質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

質問への追記・修正、ベストアンサー選択の依頼

  • chgrios

    2020/01/28 19:14

    長文での返信ありがとうございました。要約すると私は解決に必要な知識がないので、「ググれ」とのことですよね。でしたら荒らしコメントとなんらかわりはないので(だって要求ばかりして解決に微塵も貢献していないのだから)、おとなしく静観してくださいね。お疲れ様です。

    キャンセル

  • 退会済みユーザー

    2020/01/29 07:13

    複数のユーザーから「やってほしいことだけを記載した丸投げの質問」という意見がありました
    「質問を編集する」ボタンから編集を行い、調査したこと・試したことを記入していただくと、回答が得られやすくなります。

  • quickquip

    2020/01/30 08:41 編集

    seleniumの話題がでているので自分で解決しているのだろうと思っていて、自分で解決したのであれば https://teratail.com/help#resolve-myself にしたがって自分で回答を書いてベストアンサーにするだろうと思ってました。

    そうしないところから考えると、本当には理解してなくて"よくわからないままseleniumを使おうとしている"可能性があることに気づきました。既出の質問がありましたので回答に挙げておきました。

    キャンセル

回答 2

+1

もしまだ自分で解決できておらず、seleniumが必要な理由がわからないままseleniumを使おうとしているのでしたら、以下の質問を参考にしてください。

https://teratail.com/questions/223641
https://teratail.com/questions/105717
https://teratail.com/questions/124760
https://teratail.com/questions/139310
https://teratail.com/questions/163429
https://teratail.com/questions/162878
https://teratail.com/questions/172895
https://teratail.com/questions/187362

私が"seleniumでググれ"以上の回答を持たないのと同様、だいたいが"seleniumを使いましょう"という回答なことが確認できると思います。
selenium以外の回答も若干はあるようですが、情報が比較的多いseleniumでよいと私は思います。

投稿

編集

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

check解決した方法

-1

seleniumを使って取得することで解決しました。tiitoiさんありがとうございました。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 88.59%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

同じタグがついた質問を見る