質問編集履歴
3
CNNのwebサイトのリンクをつけました。
test
CHANGED
File without changes
|
test
CHANGED
@@ -1,6 +1,6 @@
|
|
1
1
|
Python初心者です。
|
2
2
|
|
3
|
-
入門書や初心者向けの解説サイトでスクレイピングを勉強したので、cnnのサイトから最新のニュースタイトルとそのURLをスクレイピングしてcsvデータに整理する、というプログラムを書いてみようと思います。
|
3
|
+
入門書や初心者向けの解説サイトでスクレイピングを勉強したので、[cnnのwebサイト](https://edition.cnn.com/)から最新のニュースタイトルとそのURLをスクレイピングしてcsvデータに整理する、というプログラムを書いてみようと思います。
|
4
4
|
|
5
5
|
HTMLデータの取得まではできるのですが、肝心のニュースタイトルとURLがうまく抜き出せず困っています。
|
6
6
|
|
2
追記を挿入しました。
test
CHANGED
File without changes
|
test
CHANGED
@@ -35,3 +35,15 @@
|
|
35
35
|
divがたくさん入れ子になっているから無理なのでしょうか?
|
36
36
|
|
37
37
|
何かヒントをいただけると嬉しいです。よろしくお願いいたします。
|
38
|
+
|
39
|
+
|
40
|
+
|
41
|
+
|
42
|
+
|
43
|
+
--追記--
|
44
|
+
|
45
|
+
soup.find_all('h3', {'class': 'cd__headline'})
|
46
|
+
|
47
|
+
とやってもダメでした。class名の_の数を間違えているのでしょうか?
|
48
|
+
|
49
|
+
カウント方法をご存知でしたら教えていただきたいです。
|
1
初心者マークをつけました。
test
CHANGED
File without changes
|
test
CHANGED
File without changes
|