teratail header banner
teratail header banner
質問するログイン新規登録

回答編集履歴

1

書式の改善

2018/02/11 05:07

投稿

K_S_
K_S_

スコア419

answer CHANGED
@@ -2,7 +2,7 @@
2
2
  Python+BeautifulSoup4の例です。
3
3
 
4
4
  0. .textを用いる場合
5
- .stringではなく.textを用いればとりあえず期待する出力は得られるようです。
5
+ .stringではなく.textを用いれば期待する出力は得られるようです。
6
6
 
7
7
  0. unwrap()を用いてsup要素を削除
8
8
  unwrap()を用いれば、要素の削除ができるようです。
@@ -17,7 +17,7 @@
17
17
  """
18
18
 
19
19
  #
20
- # そのままの場合、textで取得する方法
20
+ # .textで取得する方法
21
21
  #
22
22
  # soup = BeautifulSoup(html) と書いたらWarningが出るため下記コードにする
23
23
  soup = BeautifulSoup(html, 'lxml')
@@ -28,14 +28,6 @@
28
28
  print(a_elements[1].text)
29
29
  # Output: 100kg
30
30
 
31
- # 参考
32
- print(a_elements)
33
- # Output: <a>15m<sup>2</sup></a>, <a>100kg</a>]
34
- print(a_elements[0])
35
- # Output: <a>15m<sup>2</sup></a>
36
- print(a_elements[1])
37
- # Output: <a>100kg</a>
38
-
39
31
  #
40
32
  # unwrapを用いた場合
41
33
  #
@@ -52,7 +44,16 @@
52
44
  print(a_elements_unwrap[1].text)
53
45
  # Output: 100kg
54
46
 
47
+ #
55
48
  # 参考
49
+ #
50
+ print(a_elements)
51
+ # Output: <a>15m<sup>2</sup></a>, <a>100kg</a>]
52
+ print(a_elements[0])
53
+ # Output: <a>15m<sup>2</sup></a>
54
+ print(a_elements[1])
55
+ # Output: <a>100kg</a>
56
+
56
57
  print(a_elements_unwrap)
57
58
  # Output: [<a>15m2</a>, <a>100kg</a>]
58
59
  print(a_elements_unwrap[0])