質問編集履歴
2
書式の改善。タグにPython, Beautiful Soupを追加。
test
CHANGED
File without changes
|
test
CHANGED
@@ -18,7 +18,11 @@
|
|
18
18
|
|
19
19
|
|
20
20
|
|
21
|
+
```
|
22
|
+
|
23
|
+
# HTML
|
24
|
+
|
21
|
-
|
25
|
+
<div id="CY" class="SW">
|
22
26
|
|
23
27
|
<div class="LP-RT-AE">
|
24
28
|
|
@@ -50,13 +54,17 @@
|
|
50
54
|
|
51
55
|
<dl class="price-dl" style="height: 10px;">
|
52
56
|
|
53
|
-
<dt>pri</dt>
|
57
|
+
<dt>pri</dt>
|
58
|
+
|
59
|
+
```
|
54
60
|
|
55
61
|
|
56
62
|
|
63
|
+
```
|
64
|
+
|
57
65
|
# コード
|
58
66
|
|
59
|
-
|
67
|
+
url = 'AAAAAAAAAAAAAA'
|
60
68
|
|
61
69
|
res = requests.get(url)
|
62
70
|
|
@@ -64,7 +72,9 @@
|
|
64
72
|
|
65
73
|
soup = BeautifulSoup(content, 'html.parser')
|
66
74
|
|
67
|
-
ss = soup.find_all('div', class_='LP-RT-AE')
|
75
|
+
ss = soup.find_all('div', class_='LP-RT-AE')
|
76
|
+
|
77
|
+
```
|
68
78
|
|
69
79
|
この時点でssにh4を含む結果が残りません。
|
70
80
|
|
@@ -74,13 +84,15 @@
|
|
74
84
|
|
75
85
|
1つ階層が上の <div class="LP-RT">で
|
76
86
|
|
77
|
-
|
87
|
+
ss_old = soup.find_all('div', class_='LP-RT')
|
78
88
|
|
79
89
|
を行うと出力は以下のようになります。
|
80
90
|
|
81
91
|
|
82
92
|
|
93
|
+
```
|
94
|
+
|
83
|
-
|
95
|
+
[<div class="LP-RT">
|
84
96
|
|
85
97
|
<div class="LP-RT-CT">
|
86
98
|
|
@@ -102,13 +114,17 @@
|
|
102
114
|
|
103
115
|
</div><!-- #category -->
|
104
116
|
|
105
|
-
</div>]
|
117
|
+
</div>]
|
118
|
+
|
119
|
+
```
|
106
120
|
|
107
121
|
|
108
122
|
|
109
123
|
残りの処理については、
|
110
124
|
|
125
|
+
```
|
126
|
+
|
111
|
-
|
127
|
+
for sss in ss:
|
112
128
|
|
113
129
|
ne = sss.h4
|
114
130
|
|
@@ -116,7 +132,9 @@
|
|
116
132
|
|
117
133
|
ee = sss.h5
|
118
134
|
|
119
|
-
print(ne, ct, ee)
|
135
|
+
print(ne, ct, ee)
|
136
|
+
|
137
|
+
```
|
120
138
|
|
121
139
|
のような感じをイメージしています。
|
122
140
|
|
1
書式の改善。タグにPythonを追加。
test
CHANGED
File without changes
|
test
CHANGED
@@ -18,7 +18,7 @@
|
|
18
18
|
|
19
19
|
|
20
20
|
|
21
|
-
<div id="CY" class="SW">
|
21
|
+
```<div id="CY" class="SW">
|
22
22
|
|
23
23
|
<div class="LP-RT-AE">
|
24
24
|
|
@@ -50,13 +50,13 @@
|
|
50
50
|
|
51
51
|
<dl class="price-dl" style="height: 10px;">
|
52
52
|
|
53
|
-
<dt>pri</dt>
|
53
|
+
<dt>pri</dt>```
|
54
54
|
|
55
55
|
|
56
56
|
|
57
57
|
# コード
|
58
58
|
|
59
|
-
url = 'AAAAAAAAAAAAAA'
|
59
|
+
```url = 'AAAAAAAAAAAAAA'
|
60
60
|
|
61
61
|
res = requests.get(url)
|
62
62
|
|
@@ -64,11 +64,7 @@
|
|
64
64
|
|
65
65
|
soup = BeautifulSoup(content, 'html.parser')
|
66
66
|
|
67
|
-
|
68
|
-
|
69
|
-
|
70
|
-
|
71
|
-
ss = soup.find_all('div', class_='LP-RT-AE')
|
67
|
+
ss = soup.find_all('div', class_='LP-RT-AE')```
|
72
68
|
|
73
69
|
この時点でssにh4を含む結果が残りません。
|
74
70
|
|
@@ -78,13 +74,13 @@
|
|
78
74
|
|
79
75
|
1つ階層が上の <div class="LP-RT">で
|
80
76
|
|
81
|
-
ss_old = soup.find_all('div', class_='LP-RT')
|
77
|
+
```ss_old = soup.find_all('div', class_='LP-RT')```
|
82
78
|
|
83
79
|
を行うと出力は以下のようになります。
|
84
80
|
|
85
81
|
|
86
82
|
|
87
|
-
[<div class="LP-RT">
|
83
|
+
```[<div class="LP-RT">
|
88
84
|
|
89
85
|
<div class="LP-RT-CT">
|
90
86
|
|
@@ -106,13 +102,13 @@
|
|
106
102
|
|
107
103
|
</div><!-- #category -->
|
108
104
|
|
109
|
-
</div>]
|
105
|
+
</div>]```
|
110
106
|
|
111
107
|
|
112
108
|
|
113
109
|
残りの処理については、
|
114
110
|
|
115
|
-
for sss in ss:
|
111
|
+
```for sss in ss:
|
116
112
|
|
117
113
|
ne = sss.h4
|
118
114
|
|
@@ -120,9 +116,9 @@
|
|
120
116
|
|
121
117
|
ee = sss.h5
|
122
118
|
|
123
|
-
print(ne, ct, ee)
|
119
|
+
print(ne, ct, ee)```
|
124
120
|
|
125
|
-
をイメージしています。
|
121
|
+
のような感じをイメージしています。
|
126
122
|
|
127
123
|
|
128
124
|
|