質問編集履歴
2
追記
test
CHANGED
File without changes
|
test
CHANGED
@@ -27,3 +27,69 @@
|
|
27
27
|
'良く出来た面白い映画。学園祭でのギターの歴史をたどるパフォーマンスは圧巻。でも、一番の見所は、現代に帰る所。ハラハラドキドキで、最後に雷エネルギーを使う所が最高。また、ヘリコプターを飛ばす映像を使って、現代に戻った事を明示するシーンは、鳥肌もの']
|
28
28
|
|
29
29
|
```
|
30
|
+
|
31
|
+
|
32
|
+
|
33
|
+
#追記
|
34
|
+
|
35
|
+
html構成が非常に長くなるので、長くなるので該当コードとクロームで見た構成は以下です
|
36
|
+
|
37
|
+
```python
|
38
|
+
|
39
|
+
reviewer_url = 'https://www.jtnews.jp/cgi-bin_o/review.cgi?TITLE_NO=252&'
|
40
|
+
|
41
|
+
|
42
|
+
|
43
|
+
# 1th page
|
44
|
+
|
45
|
+
for i in range(1,2):
|
46
|
+
|
47
|
+
reviewer_url_no = reviewer_url + str(i)
|
48
|
+
|
49
|
+
|
50
|
+
|
51
|
+
#データ取得
|
52
|
+
|
53
|
+
result = requests.get(reviewer_url_no)
|
54
|
+
|
55
|
+
c = result.content
|
56
|
+
|
57
|
+
|
58
|
+
|
59
|
+
#HTMLを元に、オブジェクトを作る
|
60
|
+
|
61
|
+
soup = BeautifulSoup(c, "lxml")
|
62
|
+
|
63
|
+
```
|
64
|
+
|
65
|
+
|
66
|
+
|
67
|
+
html構成
|
68
|
+
|
69
|
+
```txt
|
70
|
+
|
71
|
+
<html>
|
72
|
+
|
73
|
+
--<hrad></head>
|
74
|
+
|
75
|
+
--<body>
|
76
|
+
|
77
|
+
--<table>
|
78
|
+
|
79
|
+
--<tbody>
|
80
|
+
|
81
|
+
--<tr>
|
82
|
+
|
83
|
+
<td valign='TOP'>ここに文章がある</td>
|
84
|
+
|
85
|
+
--</tr>
|
86
|
+
|
87
|
+
--</tbody>
|
88
|
+
|
89
|
+
--</table>
|
90
|
+
|
91
|
+
--</body>
|
92
|
+
|
93
|
+
--</html>
|
94
|
+
|
95
|
+
```
|
1
修正
test
CHANGED
@@ -1 +1 @@
|
|
1
|
-
Beautifulsoupで何の
|
1
|
+
Beautifulsoupで何のタグにも属さない文章を取得する方法
|
test
CHANGED
File without changes
|