質問編集履歴
1
画像の添付忘れ
title
CHANGED
File without changes
|
body
CHANGED
@@ -1,11 +1,11 @@
|
|
1
|
+
](556eb5257caa989c3b4324dab65ef58c.png)
|
1
2
|
### 前提・実現したいこと
|
2
3
|
Pythonでwebスクレイピングをしており,ページに含まれるデータ(文字列や値)をとってきたいと思っています.
|
3
|
-
|
4
4
|
### 発生している問題・エラーメッセージ
|
5
5
|
目的のページまでseleniumを用いて到達出来ましたが,その後HTMLの要素を指定し,findをしても要素が見つかりません.
|
6
6
|
式自体のエラーは出ていませんが,データのlenが0になってしまいます.
|
7
7
|
### 該当のソースコード
|
8
|
-
添付の
|
8
|
+
添付の画像がHTMLのソースコードです.
|
9
9
|
### 試したこと
|
10
10
|
入手したいデータのタブはtdであったため,該当のページを開いた状態でまずは以下の式を実行しました.
|
11
11
|
<プログラム>
|
@@ -24,58 +24,6 @@
|
|
24
24
|
<frame name="MAINFRAME" src="https:// /?id=7006&Token=cabc525a-9a7a-4f83-804c-6cf55e76fc77"/>
|
25
25
|
</frameset>
|
26
26
|
</html>
|
27
|
-
他の同じようなHTMLの構成のページからのデータの抜き取りは成功しており,その際のsoupはもっと長かったので,soup自体が
|
28
|
-
|
29
|
-
### 前提・実現したいこと
|
30
|
-
|
31
|
-
ここに質問の内容を詳しく書いてください。
|
32
|
-
(例)PHP(CakePHP)で●●なシステムを作っています。
|
33
|
-
■■な機能を実装中に以下のエラーメッセージが発生しました。
|
34
|
-
|
35
|
-
### 発生している問題・エラーメッセージ
|
36
|
-
|
37
|
-
```
|
38
|
-
エラーメッセージ
|
39
|
-
```
|
40
|
-
|
41
|
-
### 該当のソースコード
|
42
|
-
|
43
|
-
```ここに言語名を入力
|
44
|
-
ソースコード
|
45
|
-
```
|
46
|
-
|
47
|
-
### 試したこと
|
48
|
-
|
49
|
-
ここに問題に対して試したことを記載してください。
|
50
|
-
|
51
|
-
### 補足情報(FW/ツールのバージョンなど)
|
52
|
-
|
53
|
-
ここにより詳細な情報を記載してください。
|
54
|
-
### 前提・実現したいこと
|
55
|
-
Pythonでwebスクレイピングをしており,ページに含まれるデータ(文字列や値)をとってきたいと思っています.
|
56
|
-
### 発生している問題・エラーメッセージ
|
57
|
-
目的のページまでseleniumを用いて到達出来ましたが,その後HTMLの要素を指定し,findをしても要素が見つかりません.
|
58
|
-
式自体のエラーは出ていませんが,データのlenが0になってしまいます.
|
59
|
-
### 該当のソースコード
|
60
|
-
添付の写真がHTMLのソースコードです.
|
61
|
-
### 試したこと
|
62
|
-
入手したいデータのタブはtdであったため,該当のページを開いた状態でまずは以下の式を実行しました.
|
63
|
-
<プログラム>
|
64
|
-
page_source = driver.page_source
|
65
|
-
soup = bs4.BeautifulSoup(page_source, 'html.parser')
|
66
|
-
a=soup.find_all("head")
|
67
|
-
print(len(a))
|
68
|
-
<結果>
|
69
|
-
0
|
70
|
-
driver.find_element_by_tag_nameや,xpathなどいろいろ試しましたが,そちらも要素が見つかりません.そこで,print(soup)でsoupを書きだしたでみると以下のようになりました.
|
71
|
-
<結果>
|
72
|
-
<html xmlns="http:// "><head><title>
|
73
|
-
</title><meta content="IE=edge" http-equiv="X-UA-Compatible"/></head>
|
74
|
-
<frameset border="0" frameborder="0" framespacing="0" rows="33,*">
|
75
|
-
<frame frameborder="no" name="TOPFRAME" noresize="" scrolling="no" src="munuTop.aspx?URL=cabc525a-9a7a-4f83-804c-6cf55e76fc77"/>
|
76
|
-
<frame name="MAINFRAME" src="https:// /?id=7006&Token=cabc525a-9a7a-4f83-804c-6cf55e76fc77"/>
|
77
|
-
</frameset>
|
78
|
-
</html>
|
79
27
|
他の同じようなHTMLの構成のページからのデータの抜き取りは成功しており,その際のsoupはもっと長かったので,soup自体が読み込めていないのかと思いましたが..
|
80
28
|
結果,欲しいデータは2つ目のframeの中の方にありますが,find出来たタグはframeまでで,それ以下の,head,div等はfind出来ませんでした.framesetのlenは1,frameのlenは2という結果となり,そこまでは正しくfind出来ていました.
|
81
29
|
プログラミング初心者で,質問も初めてで作法も分からないため,おかしな点がありましたら申し訳ございません.記述が足りない部分などございましたらご指摘ください.
|