質問編集履歴

1

画像の添付忘れ

2019/05/26 15:15

投稿

tetsu1
tetsu1

スコア16

test CHANGED
File without changes
test CHANGED
@@ -1,108 +1,4 @@
1
- ### 前提・実現したいこと
2
-
3
- Pythonでwebスクレイピングをしており,ページに含まれるデータ(文字列や値)をとってきたいと思っています.
4
-
5
-
6
-
7
- ### 発生している問題・エラーメッセージ
8
-
9
- 目的のページまでseleniumを用いて到達出来ましたが,その後HTMLの要素を指定し,findをしても要素が見つかりません.
10
-
11
- 式自体のエラーは出ていませんが,データのlenが0になってしまいます.
12
-
13
- ### 該当のソースコード
14
-
15
- 添付の写真がHTMLのソースコードです.
16
-
17
- ### 試したこと
18
-
19
- 入手したいデータのタブはtdであったため,該当のページを開いた状態でまずは以下の式を実行しました.
20
-
21
- <プログラム>
22
-
23
- page_source = driver.page_source
24
-
25
- soup = bs4.BeautifulSoup(page_source, 'html.parser')
26
-
27
- a=soup.find_all("head")
28
-
29
- print(len(a))
30
-
31
- <結果>
32
-
33
- 0
34
-
35
- driver.find_element_by_tag_nameや,xpathなどいろいろ試しましたが,そちらも要素が見つかりません.そこで,print(soup)でsoupを書きだしたでみると以下のようになりました.
36
-
37
- <結果>
38
-
39
- <html xmlns="http://     "><head><title>
1
+ ![![イメージ説明](57244c5c0144471e9e8e2de3ac85bf00.png)](556eb5257caa989c3b4324dab65ef58c.png)
40
-
41
- </title><meta content="IE=edge" http-equiv="X-UA-Compatible"/></head>
42
-
43
- <frameset border="0" frameborder="0" framespacing="0" rows="33,*">
44
-
45
- <frame frameborder="no" name="TOPFRAME" noresize="" scrolling="no" src="munuTop.aspx?URL=cabc525a-9a7a-4f83-804c-6cf55e76fc77"/>
46
-
47
- <frame name="MAINFRAME" src="https:// /?id=7006&amp;Token=cabc525a-9a7a-4f83-804c-6cf55e76fc77"/>
48
-
49
- </frameset>
50
-
51
- </html>
52
-
53
- 他の同じようなHTMLの構成のページからのデータの抜き取りは成功しており,その際のsoupはもっと長かったので,soup自体が
54
-
55
-
56
-
57
- ### 前提・実現したいこと
58
-
59
-
60
-
61
- ここに質問の内容を詳しく書いてください。
62
-
63
- (例)PHP(CakePHP)で●●なシステムを作っています。
64
-
65
- ■■な機能を実装中に以下のエラーメッセージが発生しました。
66
-
67
-
68
-
69
- ### 発生している問題・エラーメッセージ
70
-
71
-
72
-
73
- ```
74
-
75
- エラーメッセージ
76
-
77
- ```
78
-
79
-
80
-
81
- ### 該当のソースコード
82
-
83
-
84
-
85
- ```ここに言語名を入力
86
-
87
- ソースコード
88
-
89
- ```
90
-
91
-
92
-
93
- ### 試したこと
94
-
95
-
96
-
97
- ここに問題に対して試したことを記載してください。
98
-
99
-
100
-
101
- ### 補足情報(FW/ツールのバージョンなど)
102
-
103
-
104
-
105
- ここにより詳細な情報を記載してください。
106
2
 
107
3
  ### 前提・実現したいこと
108
4
 
@@ -116,7 +12,7 @@
116
12
 
117
13
  ### 該当のソースコード
118
14
 
119
- 添付の写真がHTMLのソースコードです.
15
+ 添付の画像がHTMLのソースコードです.
120
16
 
121
17
  ### 試したこと
122
18