質問編集履歴
3
CNNのwebサイトのリンクをつけました。
title
CHANGED
File without changes
|
body
CHANGED
@@ -1,5 +1,5 @@
|
|
1
1
|
Python初心者です。
|
2
|
-
入門書や初心者向けの解説サイトでスクレイピングを勉強したので、cnnのサイトから最新のニュースタイトルとそのURLをスクレイピングしてcsvデータに整理する、というプログラムを書いてみようと思います。
|
2
|
+
入門書や初心者向けの解説サイトでスクレイピングを勉強したので、[cnnのwebサイト](https://edition.cnn.com/)から最新のニュースタイトルとそのURLをスクレイピングしてcsvデータに整理する、というプログラムを書いてみようと思います。
|
3
3
|
HTMLデータの取得まではできるのですが、肝心のニュースタイトルとURLがうまく抜き出せず困っています。
|
4
4
|
|
5
5
|
```python
|
2
追記を挿入しました。
title
CHANGED
File without changes
|
body
CHANGED
@@ -16,4 +16,10 @@
|
|
16
16
|

|
17
17
|
|
18
18
|
divがたくさん入れ子になっているから無理なのでしょうか?
|
19
|
-
何かヒントをいただけると嬉しいです。よろしくお願いいたします。
|
19
|
+
何かヒントをいただけると嬉しいです。よろしくお願いいたします。
|
20
|
+
|
21
|
+
|
22
|
+
--追記--
|
23
|
+
soup.find_all('h3', {'class': 'cd__headline'})
|
24
|
+
とやってもダメでした。class名の_の数を間違えているのでしょうか?
|
25
|
+
カウント方法をご存知でしたら教えていただきたいです。
|
1
初心者マークをつけました。
title
CHANGED
File without changes
|
body
CHANGED
File without changes
|