回答編集履歴

6

d

2020/02/09 09:39

投稿

tiitoi
tiitoi

スコア21956

test CHANGED
@@ -68,6 +68,10 @@
68
68
 
69
69
  ```python
70
70
 
71
+ from pprint import pprint
72
+
73
+
74
+
71
75
  import requests
72
76
 
73
77
  from bs4 import BeautifulSoup
@@ -84,12 +88,26 @@
84
88
 
85
89
 
86
90
 
91
+ data = []
92
+
87
- p_tags = soup.select("#kwdArticleBox p")
93
+ for tag in soup.select("#kwdArticleBox p"):
94
+
95
+ a_tag = tag.select_one("a:has(> strong)")
88
96
 
89
97
 
90
98
 
91
- for i, tag in enumerate(p_tags):
99
+ if not a_tag.text:
92
100
 
101
+ # PR 記事の場合、構造が違うので場合分け
102
+
103
+ a_tag = tag.select("a")[2]
104
+
105
+
106
+
107
+ data.append({"title": a_tag.text, "url": a_tag["href"]})
108
+
109
+
110
+
93
- print(tag)
111
+ pprint(data)
94
112
 
95
113
  ```

5

d

2020/02/09 09:39

投稿

tiitoi
tiitoi

スコア21956

test CHANGED
@@ -84,12 +84,12 @@
84
84
 
85
85
 
86
86
 
87
- p_tags = soup.select("#kwdArticleBox p.newsart")
87
+ p_tags = soup.select("#kwdArticleBox p")
88
88
 
89
89
 
90
90
 
91
91
  for i, tag in enumerate(p_tags):
92
92
 
93
- print(i, tag.get_text(strip=True))
93
+ print(tag)
94
94
 
95
95
  ```

4

d

2020/02/09 09:15

投稿

tiitoi
tiitoi

スコア21956

test CHANGED
@@ -82,78 +82,14 @@
82
82
 
83
83
  soup = BeautifulSoup(res.content)
84
84
 
85
+
86
+
85
- titles = [tag.get_text(strip=True) for tag in soup.select("#kwdArticleBox p.newsart strong")]
87
+ p_tags = soup.select("#kwdArticleBox p.newsart")
86
88
 
87
89
 
88
90
 
89
- for i, title in enumerate(titles):
91
+ for i, tag in enumerate(p_tags):
90
92
 
91
- print(i, title)
93
+ print(i, tag.get_text(strip=True))
92
94
 
93
95
  ```
94
-
95
-
96
-
97
- ```
98
-
99
- 0 キヤノンMJ、セキュリティソフト「ESETセキュリティ」最新版の提供を開始
100
-
101
- 1 イオンモバイル、60歳以上限定で月額980円の新プラン発表 「業界最安級」うたうキャンペーンも
102
-
103
- 2 日本HPの2020事業戦略:
104
-
105
- 3 Windows MR「HP Reverb」とワークステーション×5Gで、建築/土木のデジタルツイン構想
106
-
107
- 4 新ソリューション「Cisco Duo Security」を日本で提供へ:
108
-
109
- 5 「ネットワークをつなぐだけ」の時代は終わった シスコが約2億ドルの企業買収で挑む“ゼロトラストセキュリティ”とは
110
-
111
- 6 「Duo Security」を2020年3月に発売:
112
-
113
- 7 シスコがユーザーアクセスを含めたゼロトラストセキュリティを国内展開
114
-
115
- 8 Rust言語で記述:
116
-
117
- 9 Google、FIDOセキュリティキーのオープンソース実装「OpenSK」を発表
118
-
119
- 10 クラウド内のデータを守るには:
120
-
121
- 11 Microsoft、クラウドのプライバシーとセキュリティで「10の推奨事項を発表」
122
-
123
- 12 金融機関の1割はサイバー攻撃で大打撃 セキュリティ人材不足も浮き彫りに
124
-
125
- 13 IPAが「情報セキュリティ10大脅威 2020」を発表、「スマホ決済の不正利用」が初登場で1位
126
-
127
- 14 新型コロナウイルス流行懸念でテレワーク対応が急務、押さえておきたいセキュリティ対策とは
128
-
129
- 15 「スマホ決済の不正利用」が初登場で1位:
130
-
131
- 16 IPAが「情報セキュリティ10大脅威 2020」を発表
132
-
133
- 17 新型肺炎の広がりと、三菱電機漏えい事件の“共通点” 標的型攻撃への備えを考える
134
-
135
- 18 製造ITニュース:
136
-
137
- 19 コネクテッドカーのセキュリティ分野で富士通がUpstream Securityと協業
138
-
139
- 20 暗号通貨とランサムウェア:
140
-
141
- 21 Trend Microがスマート工場に見せかけたハニーポットを設置、どのような脅威があったのか
142
-
143
- 22 組織における脅威1位は2019年と変わらず、2020年の「情報セキュリティ10大脅威」とは
144
-
145
- 23 2019年最大の脅威は「スマホ決済の不正利用」 IPAが発表
146
-
147
- 24 総務省、日本が早急に取り組むべきサイバーセキュリティ対策を発表 近年のインシデントを踏まえ
148
-
149
- 25 この頃、セキュリティ界隈で:
150
-
151
- 26 進化を続けるマルウェア、ファイルレス攻撃とは何か
152
-
153
- 27 “5G前夜”、IoT機器への攻撃に備えよ 対策の鍵は「自動化」と「ゼロトラスト」
154
-
155
- 28 開発者に優しいセキュリティを目指す:
156
-
157
- 29 クラウドはセキュリティ上「最も弱い鎖」? Check Pointが指摘
158
-
159
- ```

3

d

2020/02/09 09:09

投稿

tiitoi
tiitoi

スコア21956

test CHANGED
@@ -59,3 +59,101 @@
59
59
  [<p>hoge1</p>, <p>hoge2</p>, <p>hoge3</p>, <p>hoge4</p>, <p>hoge5</p>]
60
60
 
61
61
  ```
62
+
63
+
64
+
65
+ ## 追記
66
+
67
+
68
+
69
+ ```python
70
+
71
+ import requests
72
+
73
+ from bs4 import BeautifulSoup
74
+
75
+
76
+
77
+ url = "https://www.itmedia.co.jp/keywords/security.html"
78
+
79
+
80
+
81
+ res = requests.get(url)
82
+
83
+ soup = BeautifulSoup(res.content)
84
+
85
+ titles = [tag.get_text(strip=True) for tag in soup.select("#kwdArticleBox p.newsart strong")]
86
+
87
+
88
+
89
+ for i, title in enumerate(titles):
90
+
91
+ print(i, title)
92
+
93
+ ```
94
+
95
+
96
+
97
+ ```
98
+
99
+ 0 キヤノンMJ、セキュリティソフト「ESETセキュリティ」最新版の提供を開始
100
+
101
+ 1 イオンモバイル、60歳以上限定で月額980円の新プラン発表 「業界最安級」うたうキャンペーンも
102
+
103
+ 2 日本HPの2020事業戦略:
104
+
105
+ 3 Windows MR「HP Reverb」とワークステーション×5Gで、建築/土木のデジタルツイン構想
106
+
107
+ 4 新ソリューション「Cisco Duo Security」を日本で提供へ:
108
+
109
+ 5 「ネットワークをつなぐだけ」の時代は終わった シスコが約2億ドルの企業買収で挑む“ゼロトラストセキュリティ”とは
110
+
111
+ 6 「Duo Security」を2020年3月に発売:
112
+
113
+ 7 シスコがユーザーアクセスを含めたゼロトラストセキュリティを国内展開
114
+
115
+ 8 Rust言語で記述:
116
+
117
+ 9 Google、FIDOセキュリティキーのオープンソース実装「OpenSK」を発表
118
+
119
+ 10 クラウド内のデータを守るには:
120
+
121
+ 11 Microsoft、クラウドのプライバシーとセキュリティで「10の推奨事項を発表」
122
+
123
+ 12 金融機関の1割はサイバー攻撃で大打撃 セキュリティ人材不足も浮き彫りに
124
+
125
+ 13 IPAが「情報セキュリティ10大脅威 2020」を発表、「スマホ決済の不正利用」が初登場で1位
126
+
127
+ 14 新型コロナウイルス流行懸念でテレワーク対応が急務、押さえておきたいセキュリティ対策とは
128
+
129
+ 15 「スマホ決済の不正利用」が初登場で1位:
130
+
131
+ 16 IPAが「情報セキュリティ10大脅威 2020」を発表
132
+
133
+ 17 新型肺炎の広がりと、三菱電機漏えい事件の“共通点” 標的型攻撃への備えを考える
134
+
135
+ 18 製造ITニュース:
136
+
137
+ 19 コネクテッドカーのセキュリティ分野で富士通がUpstream Securityと協業
138
+
139
+ 20 暗号通貨とランサムウェア:
140
+
141
+ 21 Trend Microがスマート工場に見せかけたハニーポットを設置、どのような脅威があったのか
142
+
143
+ 22 組織における脅威1位は2019年と変わらず、2020年の「情報セキュリティ10大脅威」とは
144
+
145
+ 23 2019年最大の脅威は「スマホ決済の不正利用」 IPAが発表
146
+
147
+ 24 総務省、日本が早急に取り組むべきサイバーセキュリティ対策を発表 近年のインシデントを踏まえ
148
+
149
+ 25 この頃、セキュリティ界隈で:
150
+
151
+ 26 進化を続けるマルウェア、ファイルレス攻撃とは何か
152
+
153
+ 27 “5G前夜”、IoT機器への攻撃に備えよ 対策の鍵は「自動化」と「ゼロトラスト」
154
+
155
+ 28 開発者に優しいセキュリティを目指す:
156
+
157
+ 29 クラウドはセキュリティ上「最も弱い鎖」? Check Pointが指摘
158
+
159
+ ```

2

d

2020/02/09 09:06

投稿

tiitoi
tiitoi

スコア21956

test CHANGED
@@ -4,7 +4,7 @@
4
4
 
5
5
 
6
6
 
7
- コメントやスクリプトタグ削除するコードがありますが、CSS セレクタでほしい要素だけ選択すればいいので、その処理はなくていいと思います。
7
+ コメントやスクリプトタグ削除するコードがありますが、CSS セレクタでほしい要素だけ選択すればいいので、その処理はなくていいと思います。
8
8
 
9
9
 
10
10
 

1

d

2020/02/09 08:24

投稿

tiitoi
tiitoi

スコア21956

test CHANGED
@@ -5,6 +5,10 @@
5
5
 
6
6
 
7
7
  コメントやスクリプトタグの削除はするコードがありますが、CSS セレクタでほしい要素だけ選択すればいいので、その処理はなくていいと思います。
8
+
9
+
10
+
11
+ [スタイルシートリファレンス(目的別)](http://www.htmq.com/style/#sel)
8
12
 
9
13
 
10
14