回答編集履歴
6
d
test
CHANGED
@@ -68,6 +68,10 @@
|
|
68
68
|
|
69
69
|
```python
|
70
70
|
|
71
|
+
from pprint import pprint
|
72
|
+
|
73
|
+
|
74
|
+
|
71
75
|
import requests
|
72
76
|
|
73
77
|
from bs4 import BeautifulSoup
|
@@ -84,12 +88,26 @@
|
|
84
88
|
|
85
89
|
|
86
90
|
|
91
|
+
data = []
|
92
|
+
|
87
|
-
|
93
|
+
for tag in soup.select("#kwdArticleBox p"):
|
94
|
+
|
95
|
+
a_tag = tag.select_one("a:has(> strong)")
|
88
96
|
|
89
97
|
|
90
98
|
|
91
|
-
|
99
|
+
if not a_tag.text:
|
92
100
|
|
101
|
+
# PR 記事の場合、構造が違うので場合分け
|
102
|
+
|
103
|
+
a_tag = tag.select("a")[2]
|
104
|
+
|
105
|
+
|
106
|
+
|
107
|
+
data.append({"title": a_tag.text, "url": a_tag["href"]})
|
108
|
+
|
109
|
+
|
110
|
+
|
93
|
-
|
111
|
+
pprint(data)
|
94
112
|
|
95
113
|
```
|
5
d
test
CHANGED
@@ -84,12 +84,12 @@
|
|
84
84
|
|
85
85
|
|
86
86
|
|
87
|
-
p_tags = soup.select("#kwdArticleBox p
|
87
|
+
p_tags = soup.select("#kwdArticleBox p")
|
88
88
|
|
89
89
|
|
90
90
|
|
91
91
|
for i, tag in enumerate(p_tags):
|
92
92
|
|
93
|
-
print(
|
93
|
+
print(tag)
|
94
94
|
|
95
95
|
```
|
4
d
test
CHANGED
@@ -82,78 +82,14 @@
|
|
82
82
|
|
83
83
|
soup = BeautifulSoup(res.content)
|
84
84
|
|
85
|
+
|
86
|
+
|
85
|
-
t
|
87
|
+
p_tags = soup.select("#kwdArticleBox p.newsart")
|
86
88
|
|
87
89
|
|
88
90
|
|
89
|
-
for i, t
|
91
|
+
for i, tag in enumerate(p_tags):
|
90
92
|
|
91
|
-
print(i, t
|
93
|
+
print(i, tag.get_text(strip=True))
|
92
94
|
|
93
95
|
```
|
94
|
-
|
95
|
-
|
96
|
-
|
97
|
-
```
|
98
|
-
|
99
|
-
0 キヤノンMJ、セキュリティソフト「ESETセキュリティ」最新版の提供を開始
|
100
|
-
|
101
|
-
1 イオンモバイル、60歳以上限定で月額980円の新プラン発表 「業界最安級」うたうキャンペーンも
|
102
|
-
|
103
|
-
2 日本HPの2020事業戦略:
|
104
|
-
|
105
|
-
3 Windows MR「HP Reverb」とワークステーション×5Gで、建築/土木のデジタルツイン構想
|
106
|
-
|
107
|
-
4 新ソリューション「Cisco Duo Security」を日本で提供へ:
|
108
|
-
|
109
|
-
5 「ネットワークをつなぐだけ」の時代は終わった シスコが約2億ドルの企業買収で挑む“ゼロトラストセキュリティ”とは
|
110
|
-
|
111
|
-
6 「Duo Security」を2020年3月に発売:
|
112
|
-
|
113
|
-
7 シスコがユーザーアクセスを含めたゼロトラストセキュリティを国内展開
|
114
|
-
|
115
|
-
8 Rust言語で記述:
|
116
|
-
|
117
|
-
9 Google、FIDOセキュリティキーのオープンソース実装「OpenSK」を発表
|
118
|
-
|
119
|
-
10 クラウド内のデータを守るには:
|
120
|
-
|
121
|
-
11 Microsoft、クラウドのプライバシーとセキュリティで「10の推奨事項を発表」
|
122
|
-
|
123
|
-
12 金融機関の1割はサイバー攻撃で大打撃 セキュリティ人材不足も浮き彫りに
|
124
|
-
|
125
|
-
13 IPAが「情報セキュリティ10大脅威 2020」を発表、「スマホ決済の不正利用」が初登場で1位
|
126
|
-
|
127
|
-
14 新型コロナウイルス流行懸念でテレワーク対応が急務、押さえておきたいセキュリティ対策とは
|
128
|
-
|
129
|
-
15 「スマホ決済の不正利用」が初登場で1位:
|
130
|
-
|
131
|
-
16 IPAが「情報セキュリティ10大脅威 2020」を発表
|
132
|
-
|
133
|
-
17 新型肺炎の広がりと、三菱電機漏えい事件の“共通点” 標的型攻撃への備えを考える
|
134
|
-
|
135
|
-
18 製造ITニュース:
|
136
|
-
|
137
|
-
19 コネクテッドカーのセキュリティ分野で富士通がUpstream Securityと協業
|
138
|
-
|
139
|
-
20 暗号通貨とランサムウェア:
|
140
|
-
|
141
|
-
21 Trend Microがスマート工場に見せかけたハニーポットを設置、どのような脅威があったのか
|
142
|
-
|
143
|
-
22 組織における脅威1位は2019年と変わらず、2020年の「情報セキュリティ10大脅威」とは
|
144
|
-
|
145
|
-
23 2019年最大の脅威は「スマホ決済の不正利用」 IPAが発表
|
146
|
-
|
147
|
-
24 総務省、日本が早急に取り組むべきサイバーセキュリティ対策を発表 近年のインシデントを踏まえ
|
148
|
-
|
149
|
-
25 この頃、セキュリティ界隈で:
|
150
|
-
|
151
|
-
26 進化を続けるマルウェア、ファイルレス攻撃とは何か
|
152
|
-
|
153
|
-
27 “5G前夜”、IoT機器への攻撃に備えよ 対策の鍵は「自動化」と「ゼロトラスト」
|
154
|
-
|
155
|
-
28 開発者に優しいセキュリティを目指す:
|
156
|
-
|
157
|
-
29 クラウドはセキュリティ上「最も弱い鎖」? Check Pointが指摘
|
158
|
-
|
159
|
-
```
|
3
d
test
CHANGED
@@ -59,3 +59,101 @@
|
|
59
59
|
[<p>hoge1</p>, <p>hoge2</p>, <p>hoge3</p>, <p>hoge4</p>, <p>hoge5</p>]
|
60
60
|
|
61
61
|
```
|
62
|
+
|
63
|
+
|
64
|
+
|
65
|
+
## 追記
|
66
|
+
|
67
|
+
|
68
|
+
|
69
|
+
```python
|
70
|
+
|
71
|
+
import requests
|
72
|
+
|
73
|
+
from bs4 import BeautifulSoup
|
74
|
+
|
75
|
+
|
76
|
+
|
77
|
+
url = "https://www.itmedia.co.jp/keywords/security.html"
|
78
|
+
|
79
|
+
|
80
|
+
|
81
|
+
res = requests.get(url)
|
82
|
+
|
83
|
+
soup = BeautifulSoup(res.content)
|
84
|
+
|
85
|
+
titles = [tag.get_text(strip=True) for tag in soup.select("#kwdArticleBox p.newsart strong")]
|
86
|
+
|
87
|
+
|
88
|
+
|
89
|
+
for i, title in enumerate(titles):
|
90
|
+
|
91
|
+
print(i, title)
|
92
|
+
|
93
|
+
```
|
94
|
+
|
95
|
+
|
96
|
+
|
97
|
+
```
|
98
|
+
|
99
|
+
0 キヤノンMJ、セキュリティソフト「ESETセキュリティ」最新版の提供を開始
|
100
|
+
|
101
|
+
1 イオンモバイル、60歳以上限定で月額980円の新プラン発表 「業界最安級」うたうキャンペーンも
|
102
|
+
|
103
|
+
2 日本HPの2020事業戦略:
|
104
|
+
|
105
|
+
3 Windows MR「HP Reverb」とワークステーション×5Gで、建築/土木のデジタルツイン構想
|
106
|
+
|
107
|
+
4 新ソリューション「Cisco Duo Security」を日本で提供へ:
|
108
|
+
|
109
|
+
5 「ネットワークをつなぐだけ」の時代は終わった シスコが約2億ドルの企業買収で挑む“ゼロトラストセキュリティ”とは
|
110
|
+
|
111
|
+
6 「Duo Security」を2020年3月に発売:
|
112
|
+
|
113
|
+
7 シスコがユーザーアクセスを含めたゼロトラストセキュリティを国内展開
|
114
|
+
|
115
|
+
8 Rust言語で記述:
|
116
|
+
|
117
|
+
9 Google、FIDOセキュリティキーのオープンソース実装「OpenSK」を発表
|
118
|
+
|
119
|
+
10 クラウド内のデータを守るには:
|
120
|
+
|
121
|
+
11 Microsoft、クラウドのプライバシーとセキュリティで「10の推奨事項を発表」
|
122
|
+
|
123
|
+
12 金融機関の1割はサイバー攻撃で大打撃 セキュリティ人材不足も浮き彫りに
|
124
|
+
|
125
|
+
13 IPAが「情報セキュリティ10大脅威 2020」を発表、「スマホ決済の不正利用」が初登場で1位
|
126
|
+
|
127
|
+
14 新型コロナウイルス流行懸念でテレワーク対応が急務、押さえておきたいセキュリティ対策とは
|
128
|
+
|
129
|
+
15 「スマホ決済の不正利用」が初登場で1位:
|
130
|
+
|
131
|
+
16 IPAが「情報セキュリティ10大脅威 2020」を発表
|
132
|
+
|
133
|
+
17 新型肺炎の広がりと、三菱電機漏えい事件の“共通点” 標的型攻撃への備えを考える
|
134
|
+
|
135
|
+
18 製造ITニュース:
|
136
|
+
|
137
|
+
19 コネクテッドカーのセキュリティ分野で富士通がUpstream Securityと協業
|
138
|
+
|
139
|
+
20 暗号通貨とランサムウェア:
|
140
|
+
|
141
|
+
21 Trend Microがスマート工場に見せかけたハニーポットを設置、どのような脅威があったのか
|
142
|
+
|
143
|
+
22 組織における脅威1位は2019年と変わらず、2020年の「情報セキュリティ10大脅威」とは
|
144
|
+
|
145
|
+
23 2019年最大の脅威は「スマホ決済の不正利用」 IPAが発表
|
146
|
+
|
147
|
+
24 総務省、日本が早急に取り組むべきサイバーセキュリティ対策を発表 近年のインシデントを踏まえ
|
148
|
+
|
149
|
+
25 この頃、セキュリティ界隈で:
|
150
|
+
|
151
|
+
26 進化を続けるマルウェア、ファイルレス攻撃とは何か
|
152
|
+
|
153
|
+
27 “5G前夜”、IoT機器への攻撃に備えよ 対策の鍵は「自動化」と「ゼロトラスト」
|
154
|
+
|
155
|
+
28 開発者に優しいセキュリティを目指す:
|
156
|
+
|
157
|
+
29 クラウドはセキュリティ上「最も弱い鎖」? Check Pointが指摘
|
158
|
+
|
159
|
+
```
|
2
d
test
CHANGED
@@ -4,7 +4,7 @@
|
|
4
4
|
|
5
5
|
|
6
6
|
|
7
|
-
コメントやスクリプトタグ
|
7
|
+
コメントやスクリプトタグを削除するコードがありますが、CSS セレクタでほしい要素だけ選択すればいいので、その処理はなくていいと思います。
|
8
8
|
|
9
9
|
|
10
10
|
|
1
d
test
CHANGED
@@ -5,6 +5,10 @@
|
|
5
5
|
|
6
6
|
|
7
7
|
コメントやスクリプトタグの削除はするコードがありますが、CSS セレクタでほしい要素だけ選択すればいいので、その処理はなくていいと思います。
|
8
|
+
|
9
|
+
|
10
|
+
|
11
|
+
[スタイルシートリファレンス(目的別)](http://www.htmq.com/style/#sel)
|
8
12
|
|
9
13
|
|
10
14
|
|