質問編集履歴

3

CNNのwebサイトのリンクをつけました。

2019/02/21 13:40

投稿

aomatsu_
aomatsu_

スコア18

test CHANGED
File without changes
test CHANGED
@@ -1,6 +1,6 @@
1
1
  Python初心者です。
2
2
 
3
- 入門書や初心者向けの解説サイトでスクレイピングを勉強したので、cnnのサイトから最新のニュースタイトルとそのURLをスクレイピングしてcsvデータに整理する、というプログラムを書いてみようと思います。
3
+ 入門書や初心者向けの解説サイトでスクレイピングを勉強したので、[cnnのwebサイト](https://edition.cnn.com/)から最新のニュースタイトルとそのURLをスクレイピングしてcsvデータに整理する、というプログラムを書いてみようと思います。
4
4
 
5
5
  HTMLデータの取得まではできるのですが、肝心のニュースタイトルとURLがうまく抜き出せず困っています。
6
6
 

2

追記を挿入しました。

2019/02/21 13:40

投稿

aomatsu_
aomatsu_

スコア18

test CHANGED
File without changes
test CHANGED
@@ -35,3 +35,15 @@
35
35
  divがたくさん入れ子になっているから無理なのでしょうか?
36
36
 
37
37
  何かヒントをいただけると嬉しいです。よろしくお願いいたします。
38
+
39
+
40
+
41
+
42
+
43
+ --追記--
44
+
45
+ soup.find_all('h3', {'class': 'cd__headline'})
46
+
47
+ とやってもダメでした。class名の_の数を間違えているのでしょうか?
48
+
49
+ カウント方法をご存知でしたら教えていただきたいです。

1

初心者マークをつけました。

2019/02/19 17:00

投稿

aomatsu_
aomatsu_

スコア18

test CHANGED
File without changes
test CHANGED
File without changes