teratail header banner
teratail header banner
質問するログイン新規登録

質問編集履歴

3

CNNのwebサイトのリンクをつけました。

2019/02/21 13:40

投稿

aomatsu_
aomatsu_

スコア18

title CHANGED
File without changes
body CHANGED
@@ -1,5 +1,5 @@
1
1
  Python初心者です。
2
- 入門書や初心者向けの解説サイトでスクレイピングを勉強したので、cnnのサイトから最新のニュースタイトルとそのURLをスクレイピングしてcsvデータに整理する、というプログラムを書いてみようと思います。
2
+ 入門書や初心者向けの解説サイトでスクレイピングを勉強したので、[cnnのwebサイト](https://edition.cnn.com/)から最新のニュースタイトルとそのURLをスクレイピングしてcsvデータに整理する、というプログラムを書いてみようと思います。
3
3
  HTMLデータの取得まではできるのですが、肝心のニュースタイトルとURLがうまく抜き出せず困っています。
4
4
 
5
5
  ```python

2

追記を挿入しました。

2019/02/21 13:40

投稿

aomatsu_
aomatsu_

スコア18

title CHANGED
File without changes
body CHANGED
@@ -16,4 +16,10 @@
16
16
  ![参考画像](c2a471c325124c3e4901b5f9e4eff211.png)
17
17
 
18
18
  divがたくさん入れ子になっているから無理なのでしょうか?
19
- 何かヒントをいただけると嬉しいです。よろしくお願いいたします。
19
+ 何かヒントをいただけると嬉しいです。よろしくお願いいたします。
20
+
21
+
22
+ --追記--
23
+ soup.find_all('h3', {'class': 'cd__headline'})
24
+ とやってもダメでした。class名の_の数を間違えているのでしょうか?
25
+ カウント方法をご存知でしたら教えていただきたいです。

1

初心者マークをつけました。

2019/02/19 17:00

投稿

aomatsu_
aomatsu_

スコア18

title CHANGED
File without changes
body CHANGED
File without changes