質問編集履歴
2
追記
title
CHANGED
File without changes
|
body
CHANGED
@@ -12,4 +12,37 @@
|
|
12
12
|
```python
|
13
13
|
['年取ってから改めて観てみると、意外に面白くなかったり、今時これじゃあ物足りないと思ったりしてしまう映画はたくさんあるが、この映画はいつ観ても、何度観てもやっぱりワクワクドキドキしてしまう。きっと百年後も、ずっと愛され続ける映画の一本。',
|
14
14
|
'良く出来た面白い映画。学園祭でのギターの歴史をたどるパフォーマンスは圧巻。でも、一番の見所は、現代に帰る所。ハラハラドキドキで、最後に雷エネルギーを使う所が最高。また、ヘリコプターを飛ばす映像を使って、現代に戻った事を明示するシーンは、鳥肌もの']
|
15
|
+
```
|
16
|
+
|
17
|
+
#追記
|
18
|
+
html構成が非常に長くなるので、長くなるので該当コードとクロームで見た構成は以下です
|
19
|
+
```python
|
20
|
+
reviewer_url = 'https://www.jtnews.jp/cgi-bin_o/review.cgi?TITLE_NO=252&'
|
21
|
+
|
22
|
+
# 1th page
|
23
|
+
for i in range(1,2):
|
24
|
+
reviewer_url_no = reviewer_url + str(i)
|
25
|
+
|
26
|
+
#データ取得
|
27
|
+
result = requests.get(reviewer_url_no)
|
28
|
+
c = result.content
|
29
|
+
|
30
|
+
#HTMLを元に、オブジェクトを作る
|
31
|
+
soup = BeautifulSoup(c, "lxml")
|
32
|
+
```
|
33
|
+
|
34
|
+
html構成
|
35
|
+
```txt
|
36
|
+
<html>
|
37
|
+
--<hrad></head>
|
38
|
+
--<body>
|
39
|
+
--<table>
|
40
|
+
--<tbody>
|
41
|
+
--<tr>
|
42
|
+
<td valign='TOP'>ここに文章がある</td>
|
43
|
+
--</tr>
|
44
|
+
--</tbody>
|
45
|
+
--</table>
|
46
|
+
--</body>
|
47
|
+
--</html>
|
15
48
|
```
|
1
修正
title
CHANGED
@@ -1,1 +1,1 @@
|
|
1
|
-
Beautifulsoupで何の
|
1
|
+
Beautifulsoupで何のタグにも属さない文章を取得する方法
|
body
CHANGED
File without changes
|