質問編集履歴
1
画像の添付忘れ
    
        title	
    CHANGED
    
    | 
         
            File without changes
         
     | 
    
        body	
    CHANGED
    
    | 
         @@ -1,11 +1,11 @@ 
     | 
|
| 
      
 1 
     | 
    
         
            +
            ](556eb5257caa989c3b4324dab65ef58c.png)
         
     | 
| 
       1 
2 
     | 
    
         
             
            ### 前提・実現したいこと
         
     | 
| 
       2 
3 
     | 
    
         
             
            Pythonでwebスクレイピングをしており,ページに含まれるデータ(文字列や値)をとってきたいと思っています.
         
     | 
| 
       3 
     | 
    
         
            -
             
     | 
| 
       4 
4 
     | 
    
         
             
            ### 発生している問題・エラーメッセージ
         
     | 
| 
       5 
5 
     | 
    
         
             
            目的のページまでseleniumを用いて到達出来ましたが,その後HTMLの要素を指定し,findをしても要素が見つかりません.
         
     | 
| 
       6 
6 
     | 
    
         
             
            式自体のエラーは出ていませんが,データのlenが0になってしまいます.
         
     | 
| 
       7 
7 
     | 
    
         
             
            ### 該当のソースコード
         
     | 
| 
       8 
     | 
    
         
            -
            添付の 
     | 
| 
      
 8 
     | 
    
         
            +
            添付の画像がHTMLのソースコードです.
         
     | 
| 
       9 
9 
     | 
    
         
             
            ### 試したこと
         
     | 
| 
       10 
10 
     | 
    
         
             
            入手したいデータのタブはtdであったため,該当のページを開いた状態でまずは以下の式を実行しました.
         
     | 
| 
       11 
11 
     | 
    
         
             
            <プログラム>
         
     | 
| 
         @@ -24,58 +24,6 @@ 
     | 
|
| 
       24 
24 
     | 
    
         
             
            <frame name="MAINFRAME" src="https://                      /?id=7006&Token=cabc525a-9a7a-4f83-804c-6cf55e76fc77"/>
         
     | 
| 
       25 
25 
     | 
    
         
             
            </frameset>
         
     | 
| 
       26 
26 
     | 
    
         
             
            </html>
         
     | 
| 
       27 
     | 
    
         
            -
            他の同じようなHTMLの構成のページからのデータの抜き取りは成功しており,その際のsoupはもっと長かったので,soup自体が
         
     | 
| 
       28 
     | 
    
         
            -
             
     | 
| 
       29 
     | 
    
         
            -
            ### 前提・実現したいこと
         
     | 
| 
       30 
     | 
    
         
            -
             
     | 
| 
       31 
     | 
    
         
            -
            ここに質問の内容を詳しく書いてください。
         
     | 
| 
       32 
     | 
    
         
            -
            (例)PHP(CakePHP)で●●なシステムを作っています。
         
     | 
| 
       33 
     | 
    
         
            -
            ■■な機能を実装中に以下のエラーメッセージが発生しました。
         
     | 
| 
       34 
     | 
    
         
            -
             
     | 
| 
       35 
     | 
    
         
            -
            ### 発生している問題・エラーメッセージ
         
     | 
| 
       36 
     | 
    
         
            -
             
     | 
| 
       37 
     | 
    
         
            -
            ```
         
     | 
| 
       38 
     | 
    
         
            -
            エラーメッセージ
         
     | 
| 
       39 
     | 
    
         
            -
            ```
         
     | 
| 
       40 
     | 
    
         
            -
             
     | 
| 
       41 
     | 
    
         
            -
            ### 該当のソースコード
         
     | 
| 
       42 
     | 
    
         
            -
             
     | 
| 
       43 
     | 
    
         
            -
            ```ここに言語名を入力
         
     | 
| 
       44 
     | 
    
         
            -
            ソースコード
         
     | 
| 
       45 
     | 
    
         
            -
            ```
         
     | 
| 
       46 
     | 
    
         
            -
             
     | 
| 
       47 
     | 
    
         
            -
            ### 試したこと
         
     | 
| 
       48 
     | 
    
         
            -
             
     | 
| 
       49 
     | 
    
         
            -
            ここに問題に対して試したことを記載してください。
         
     | 
| 
       50 
     | 
    
         
            -
             
     | 
| 
       51 
     | 
    
         
            -
            ### 補足情報(FW/ツールのバージョンなど)
         
     | 
| 
       52 
     | 
    
         
            -
             
     | 
| 
       53 
     | 
    
         
            -
            ここにより詳細な情報を記載してください。
         
     | 
| 
       54 
     | 
    
         
            -
            ### 前提・実現したいこと
         
     | 
| 
       55 
     | 
    
         
            -
            Pythonでwebスクレイピングをしており,ページに含まれるデータ(文字列や値)をとってきたいと思っています.
         
     | 
| 
       56 
     | 
    
         
            -
            ### 発生している問題・エラーメッセージ
         
     | 
| 
       57 
     | 
    
         
            -
            目的のページまでseleniumを用いて到達出来ましたが,その後HTMLの要素を指定し,findをしても要素が見つかりません.
         
     | 
| 
       58 
     | 
    
         
            -
            式自体のエラーは出ていませんが,データのlenが0になってしまいます.
         
     | 
| 
       59 
     | 
    
         
            -
            ### 該当のソースコード
         
     | 
| 
       60 
     | 
    
         
            -
            添付の写真がHTMLのソースコードです.
         
     | 
| 
       61 
     | 
    
         
            -
            ### 試したこと
         
     | 
| 
       62 
     | 
    
         
            -
            入手したいデータのタブはtdであったため,該当のページを開いた状態でまずは以下の式を実行しました.
         
     | 
| 
       63 
     | 
    
         
            -
            <プログラム>
         
     | 
| 
       64 
     | 
    
         
            -
            page_source = driver.page_source
         
     | 
| 
       65 
     | 
    
         
            -
            soup = bs4.BeautifulSoup(page_source, 'html.parser')
         
     | 
| 
       66 
     | 
    
         
            -
            a=soup.find_all("head")
         
     | 
| 
       67 
     | 
    
         
            -
            print(len(a))
         
     | 
| 
       68 
     | 
    
         
            -
            <結果>
         
     | 
| 
       69 
     | 
    
         
            -
            0
         
     | 
| 
       70 
     | 
    
         
            -
            driver.find_element_by_tag_nameや,xpathなどいろいろ試しましたが,そちらも要素が見つかりません.そこで,print(soup)でsoupを書きだしたでみると以下のようになりました.
         
     | 
| 
       71 
     | 
    
         
            -
            <結果>
         
     | 
| 
       72 
     | 
    
         
            -
            <html xmlns="http://     "><head><title>
         
     | 
| 
       73 
     | 
    
         
            -
            </title><meta content="IE=edge" http-equiv="X-UA-Compatible"/></head>
         
     | 
| 
       74 
     | 
    
         
            -
            <frameset border="0" frameborder="0" framespacing="0" rows="33,*">
         
     | 
| 
       75 
     | 
    
         
            -
            <frame frameborder="no" name="TOPFRAME" noresize="" scrolling="no" src="munuTop.aspx?URL=cabc525a-9a7a-4f83-804c-6cf55e76fc77"/>
         
     | 
| 
       76 
     | 
    
         
            -
            <frame name="MAINFRAME" src="https://                      /?id=7006&Token=cabc525a-9a7a-4f83-804c-6cf55e76fc77"/>
         
     | 
| 
       77 
     | 
    
         
            -
            </frameset>
         
     | 
| 
       78 
     | 
    
         
            -
            </html>
         
     | 
| 
       79 
27 
     | 
    
         
             
            他の同じようなHTMLの構成のページからのデータの抜き取りは成功しており,その際のsoupはもっと長かったので,soup自体が読み込めていないのかと思いましたが..
         
     | 
| 
       80 
28 
     | 
    
         
             
            結果,欲しいデータは2つ目のframeの中の方にありますが,find出来たタグはframeまでで,それ以下の,head,div等はfind出来ませんでした.framesetのlenは1,frameのlenは2という結果となり,そこまでは正しくfind出来ていました.
         
     | 
| 
       81 
29 
     | 
    
         
             
            プログラミング初心者で,質問も初めてで作法も分からないため,おかしな点がありましたら申し訳ございません.記述が足りない部分などございましたらご指摘ください.
         
     |