teratail header banner
teratail header banner
質問するログイン新規登録

質問編集履歴

1

画像の添付忘れ

2019/05/26 15:15

投稿

tetsu1
tetsu1

スコア16

title CHANGED
File without changes
body CHANGED
@@ -1,11 +1,11 @@
1
+ ![![イメージ説明](57244c5c0144471e9e8e2de3ac85bf00.png)](556eb5257caa989c3b4324dab65ef58c.png)
1
2
  ### 前提・実現したいこと
2
3
  Pythonでwebスクレイピングをしており,ページに含まれるデータ(文字列や値)をとってきたいと思っています.
3
-
4
4
  ### 発生している問題・エラーメッセージ
5
5
  目的のページまでseleniumを用いて到達出来ましたが,その後HTMLの要素を指定し,findをしても要素が見つかりません.
6
6
  式自体のエラーは出ていませんが,データのlenが0になってしまいます.
7
7
  ### 該当のソースコード
8
- 添付の写真がHTMLのソースコードです.
8
+ 添付の画像がHTMLのソースコードです.
9
9
  ### 試したこと
10
10
  入手したいデータのタブはtdであったため,該当のページを開いた状態でまずは以下の式を実行しました.
11
11
  <プログラム>
@@ -24,58 +24,6 @@
24
24
  <frame name="MAINFRAME" src="https:// /?id=7006&amp;Token=cabc525a-9a7a-4f83-804c-6cf55e76fc77"/>
25
25
  </frameset>
26
26
  </html>
27
- 他の同じようなHTMLの構成のページからのデータの抜き取りは成功しており,その際のsoupはもっと長かったので,soup自体が
28
-
29
- ### 前提・実現したいこと
30
-
31
- ここに質問の内容を詳しく書いてください。
32
- (例)PHP(CakePHP)で●●なシステムを作っています。
33
- ■■な機能を実装中に以下のエラーメッセージが発生しました。
34
-
35
- ### 発生している問題・エラーメッセージ
36
-
37
- ```
38
- エラーメッセージ
39
- ```
40
-
41
- ### 該当のソースコード
42
-
43
- ```ここに言語名を入力
44
- ソースコード
45
- ```
46
-
47
- ### 試したこと
48
-
49
- ここに問題に対して試したことを記載してください。
50
-
51
- ### 補足情報(FW/ツールのバージョンなど)
52
-
53
- ここにより詳細な情報を記載してください。
54
- ### 前提・実現したいこと
55
- Pythonでwebスクレイピングをしており,ページに含まれるデータ(文字列や値)をとってきたいと思っています.
56
- ### 発生している問題・エラーメッセージ
57
- 目的のページまでseleniumを用いて到達出来ましたが,その後HTMLの要素を指定し,findをしても要素が見つかりません.
58
- 式自体のエラーは出ていませんが,データのlenが0になってしまいます.
59
- ### 該当のソースコード
60
- 添付の写真がHTMLのソースコードです.
61
- ### 試したこと
62
- 入手したいデータのタブはtdであったため,該当のページを開いた状態でまずは以下の式を実行しました.
63
- <プログラム>
64
- page_source = driver.page_source
65
- soup = bs4.BeautifulSoup(page_source, 'html.parser')
66
- a=soup.find_all("head")
67
- print(len(a))
68
- <結果>
69
- 0
70
- driver.find_element_by_tag_nameや,xpathなどいろいろ試しましたが,そちらも要素が見つかりません.そこで,print(soup)でsoupを書きだしたでみると以下のようになりました.
71
- <結果>
72
- <html xmlns="http://     "><head><title>
73
- </title><meta content="IE=edge" http-equiv="X-UA-Compatible"/></head>
74
- <frameset border="0" frameborder="0" framespacing="0" rows="33,*">
75
- <frame frameborder="no" name="TOPFRAME" noresize="" scrolling="no" src="munuTop.aspx?URL=cabc525a-9a7a-4f83-804c-6cf55e76fc77"/>
76
- <frame name="MAINFRAME" src="https:// /?id=7006&amp;Token=cabc525a-9a7a-4f83-804c-6cf55e76fc77"/>
77
- </frameset>
78
- </html>
79
27
  他の同じようなHTMLの構成のページからのデータの抜き取りは成功しており,その際のsoupはもっと長かったので,soup自体が読み込めていないのかと思いましたが..
80
28
  結果,欲しいデータは2つ目のframeの中の方にありますが,find出来たタグはframeまでで,それ以下の,head,div等はfind出来ませんでした.framesetのlenは1,frameのlenは2という結果となり,そこまでは正しくfind出来ていました.
81
29
  プログラミング初心者で,質問も初めてで作法も分からないため,おかしな点がありましたら申し訳ございません.記述が足りない部分などございましたらご指摘ください.