teratail header banner
teratail header banner
質問するログイン新規登録

質問編集履歴

3

修正

2020/02/03 08:56

投稿

ruuuu
ruuuu

スコア176

title CHANGED
File without changes
body CHANGED
@@ -1,5 +1,5 @@
1
1
  Beautifulsoupにて、ある子要素のテキストのみを取得する方法はありますでしょうか...?
2
- 以下のHTMLなのですが、仮に、sectionのクラス```content```を```body = soup.select_one('content')```のような形で取得し、```print(body.text)```とすると、```div```内の「テキスト」といった文字まで取得されてしまいます。
2
+ 以下のHTMLなのですが、仮に、sectionのクラス```content```を```body = soup.select_one('.content')```のような形で取得し、```print(body.text)```とすると、```div```内の「テキスト」といった文字まで取得されてしまいます。
3
3
  これを、子要素のタグの文字列は取得せず「hello」の文字列だけ取得する方法がありましたら、教えて頂きたいです。
4
4
  ```
5
5
  <section class="content">

2

追記

2020/02/03 08:56

投稿

ruuuu
ruuuu

スコア176

title CHANGED
File without changes
body CHANGED
@@ -1,5 +1,5 @@
1
1
  Beautifulsoupにて、ある子要素のテキストのみを取得する方法はありますでしょうか...?
2
- 以下のHTMLなのですが、仮に、sectionのクラス```content```を```body = soup.select_one('content')```のような形で取得し、```print(bocy.text)```とすると、```div```内の「テキスト」といった文字まで取得されてしまいます。
2
+ 以下のHTMLなのですが、仮に、sectionのクラス```content```を```body = soup.select_one('content')```のような形で取得し、```print(body.text)```とすると、```div```内の「テキスト」といった文字まで取得されてしまいます。
3
3
  これを、子要素のタグの文字列は取得せず「hello」の文字列だけ取得する方法がありましたら、教えて頂きたいです。
4
4
  ```
5
5
  <section class="content">

1

追記

2020/02/01 17:48

投稿

ruuuu
ruuuu

スコア176

title CHANGED
File without changes
body CHANGED
@@ -10,4 +10,5 @@
10
10
  <div>テキスト</div>
11
11
 
12
12
  </section>
13
- ```
13
+ ```
14
+ ※```soup```はBeautifulsoupオブジェクトです。