質問するログイン新規登録

回答編集履歴

1

HTML全体の中から、特定のtagのみ削除(その子供は残す)するコード

2017/04/26 13:10

投稿

coba-coba
coba-coba

スコア1409

answer CHANGED
@@ -16,4 +16,46 @@
16
16
  #出力
17
17
  <img class="hogehoge" src="http://hogehoge.com/fuga.jpg">
18
18
  </img>
19
+ ```
20
+
21
+ 追記
22
+ ---
23
+ HTML全体の中から、特定のtagのみ削除(その子供は残す)するコード。
24
+ ```Python
25
+ import bs4
26
+
27
+ html = """
28
+ <body>
29
+ <p>
30
+ <a href="http://hogehoge.com/fuga.jpg">
31
+ <img class="hogehoge" src="http://hoge.example.com/hoge.jpg">
32
+ </a>
33
+ </p>
34
+ <p>
35
+ <a href="http://hogehoge.com/fuga.jpg">
36
+ <img class="hogehoge" src="http://fuga.example.com/fuga.jpg">
37
+ </a>
38
+ </p>
39
+ </body>
40
+ """
41
+
42
+ soup = bs4.BeautifulSoup(html, "html.parser")
43
+
44
+ while (soup.a):
45
+ soup.a.unwrap()
46
+
47
+ print(soup.prettify())
48
+ ```
49
+ ```
50
+ # 出力
51
+ <body>
52
+ <p>
53
+ <img class="hogehoge" src="http://hoge.example.com/hoge.jpg">
54
+ </img>
55
+ </p>
56
+ <p>
57
+ <img class="hogehoge" src="http://fuga.example.com/fuga.jpg">
58
+ </img>
59
+ </p>
60
+ </body>
19
61
  ```