質問編集履歴
3
説明不足
test
CHANGED
@@ -1 +1 @@
|
|
1
|
-
スクレイピングで複数のURLを取得したいです。
|
1
|
+
スクレイピングで複数のURLを取得したいです。(質問修正後)
|
test
CHANGED
File without changes
|
2
説明不足
test
CHANGED
File without changes
|
test
CHANGED
@@ -35,6 +35,12 @@
|
|
35
35
|
|
36
36
|
|
37
37
|
```
|
38
|
+
|
39
|
+
|
40
|
+
|
41
|
+
下のHTMLで書かれたコードの中の
|
42
|
+
|
43
|
+
取得したいURLだけを取得したのですが
|
38
44
|
|
39
45
|
こちらのコードだと
|
40
46
|
|
@@ -142,7 +148,7 @@
|
|
142
148
|
|
143
149
|
|
144
150
|
|
145
|
-
|
151
|
+
取得したいURLだけを取得したい場合は
|
146
152
|
|
147
153
|
どういたコードが良いでしょうか?
|
148
154
|
|
1
説明不足
test
CHANGED
File without changes
|
test
CHANGED
@@ -24,7 +24,9 @@
|
|
24
24
|
|
25
25
|
get_class = soup.find(class_="aaa")
|
26
26
|
|
27
|
+
get_class2 = get_class.find_all(class="ccc")
|
28
|
+
|
27
|
-
get_link = get_class.find_all("a")
|
29
|
+
get_link = get_class2.find_all("a")
|
28
30
|
|
29
31
|
for a in get_link:
|
30
32
|
|
@@ -34,23 +36,9 @@
|
|
34
36
|
|
35
37
|
```
|
36
38
|
|
37
|
-
|
39
|
+
こちらのコードだと
|
38
40
|
|
39
|
-
find_allの中身を変えてみたりしましたが
|
40
|
-
|
41
|
-
うまくいきませんでした。
|
42
|
-
|
43
|
-
|
44
|
-
|
45
|
-
find_all("aaa")だと実行結果は
|
46
|
-
|
47
|
-
AttributeError
|
41
|
+
AttributeErrorのエラーが出てしまいます。
|
48
|
-
|
49
|
-
|
50
|
-
|
51
|
-
find_all("bbb")だと実行結果は
|
52
|
-
|
53
|
-
繰り返しの文字の羅列が出されるだけでした
|
54
42
|
|
55
43
|
|
56
44
|
|
@@ -74,6 +62,12 @@
|
|
74
62
|
|
75
63
|
</a>
|
76
64
|
|
65
|
+
<p calss="ddd">
|
66
|
+
|
67
|
+
<a href="取得したくないURL"></a>
|
68
|
+
|
69
|
+
</p>
|
70
|
+
|
77
71
|
</div>
|
78
72
|
|
79
73
|
</li>
|
@@ -86,6 +80,12 @@
|
|
86
80
|
|
87
81
|
</a>
|
88
82
|
|
83
|
+
<p calss="ddd">
|
84
|
+
|
85
|
+
<a href="取得したくないURL"></a>
|
86
|
+
|
87
|
+
</p>
|
88
|
+
|
89
89
|
</div>
|
90
90
|
|
91
91
|
</li>
|
@@ -97,6 +97,12 @@
|
|
97
97
|
<a href="取得したいURL3" class="wrap">
|
98
98
|
|
99
99
|
</a>
|
100
|
+
|
101
|
+
<p calss="ddd">
|
102
|
+
|
103
|
+
<a href="取得したくないURL"></a>
|
104
|
+
|
105
|
+
</p>
|
100
106
|
|
101
107
|
</div>
|
102
108
|
|
@@ -116,6 +122,12 @@
|
|
116
122
|
|
117
123
|
</a>
|
118
124
|
|
125
|
+
<p calss="ddd">
|
126
|
+
|
127
|
+
<a href="取得したくないURL"></a>
|
128
|
+
|
129
|
+
</p>
|
130
|
+
|
119
131
|
</div>
|
120
132
|
|
121
133
|
</li>
|
@@ -130,6 +142,8 @@
|
|
130
142
|
|
131
143
|
|
132
144
|
|
145
|
+
|
146
|
+
|
133
147
|
どういたコードが良いでしょうか?
|
134
148
|
|
135
149
|
教えていただけると幸いです。
|