回答編集履歴
1
書式の改善
answer
CHANGED
@@ -2,7 +2,7 @@
|
|
2
2
|
Python+BeautifulSoup4の例です。
|
3
3
|
|
4
4
|
0. .textを用いる場合
|
5
|
-
.stringではなく
|
5
|
+
.stringではなく.textを用いれば、期待する出力は得られるようです。
|
6
6
|
|
7
7
|
0. unwrap()を用いてsup要素を削除
|
8
8
|
unwrap()を用いれば、要素の削除ができるようです。
|
@@ -17,7 +17,7 @@
|
|
17
17
|
"""
|
18
18
|
|
19
19
|
#
|
20
|
-
#
|
20
|
+
# .textで取得する方法
|
21
21
|
#
|
22
22
|
# soup = BeautifulSoup(html) と書いたらWarningが出るため下記コードにする
|
23
23
|
soup = BeautifulSoup(html, 'lxml')
|
@@ -28,14 +28,6 @@
|
|
28
28
|
print(a_elements[1].text)
|
29
29
|
# Output: 100kg
|
30
30
|
|
31
|
-
# 参考
|
32
|
-
print(a_elements)
|
33
|
-
# Output: <a>15m<sup>2</sup></a>, <a>100kg</a>]
|
34
|
-
print(a_elements[0])
|
35
|
-
# Output: <a>15m<sup>2</sup></a>
|
36
|
-
print(a_elements[1])
|
37
|
-
# Output: <a>100kg</a>
|
38
|
-
|
39
31
|
#
|
40
32
|
# unwrapを用いた場合
|
41
33
|
#
|
@@ -52,7 +44,16 @@
|
|
52
44
|
print(a_elements_unwrap[1].text)
|
53
45
|
# Output: 100kg
|
54
46
|
|
47
|
+
#
|
55
48
|
# 参考
|
49
|
+
#
|
50
|
+
print(a_elements)
|
51
|
+
# Output: <a>15m<sup>2</sup></a>, <a>100kg</a>]
|
52
|
+
print(a_elements[0])
|
53
|
+
# Output: <a>15m<sup>2</sup></a>
|
54
|
+
print(a_elements[1])
|
55
|
+
# Output: <a>100kg</a>
|
56
|
+
|
56
57
|
print(a_elements_unwrap)
|
57
58
|
# Output: [<a>15m2</a>, <a>100kg</a>]
|
58
59
|
print(a_elements_unwrap[0])
|