質問編集履歴

3

タイトルの変更

2020/07/25 08:53

投稿

mochiro
mochiro

スコア1

test CHANGED
@@ -1 +1 @@
1
- 同じタグの位置を指定してのスクレイピングについて
1
+ pythonによる同じタグの位置を指定してのスクレイピングについて
test CHANGED
File without changes

2

試したコードの追記

2020/07/25 08:53

投稿

mochiro
mochiro

スコア1

test CHANGED
File without changes
test CHANGED
@@ -44,13 +44,45 @@
44
44
 
45
45
 
46
46
 
47
- ### やってみこと
47
+ ### 試しコード
48
48
 
49
+ ```ここに言語を入力
50
+
51
+ html = requests.get(link)
52
+
53
+ soup = BeautifulSoup(html.content, 'html.parser')
54
+
55
+ elme = soup.find('div', class_='contents')
56
+
57
+ tbodies = elme.find_all('tbody')
58
+
59
+ pprint.pprint(tbodies)  #tbodiesの確認
60
+
61
+ del tbodies[0]
62
+
63
+ pprint.pprint(tbodies)  #0インデックスのリスト削除後のtbodiesの確認
64
+
65
+ ```
66
+
49
- 試してみたことはclass_='contents'を指定し、一度find_allでtbody情報をすべて取得し、その後 del リスト名[0]で1つ目のtbody情報を消してみました。
67
+ 上記のようにclass_='contents'を指定し、一度find_allでtbody情報をすべて取得し、その後 del リスト名[0]で1つ目のtbody情報を消してみました。
50
68
 
51
69
 
52
70
 
71
+
72
+
73
+ ### 結果
74
+
75
+ ```ここに言語を入力
76
+
77
+ [<tbody><tr>~~</tr><tr>~~</tr>・・・・</tr></tbody>,<tbody><tr>~~</tr><tr>~~</tr>・・・・</tr></tbody>]
78
+
79
+ [<tbody><tr>~~</tr><tr>~~</tr>・・・・</tr></tbody>]
80
+
81
+ ```
82
+
83
+
84
+
53
- しかし、この方法だと2つ目のtbody内の情報は取得できるもののまとまったstr型?であり、trタグごとのリスト型として取得できておりません。
85
+ 結果は2つ目のtbody内の情報は取得できるもののまとまりのstr型?となってしまい、trタグごとのリスト型として取得できておりません。
54
86
 
55
87
 
56
88
 

1

タグの追加

2020/07/25 04:58

投稿

mochiro
mochiro

スコア1

test CHANGED
File without changes
test CHANGED
File without changes