質問編集履歴
3
タイトルの変更
test
CHANGED
@@ -1 +1 @@
|
|
1
|
-
同じタグの位置を指定してのスクレイピングについて
|
1
|
+
pythonによる同じタグの位置を指定してのスクレイピングについて
|
test
CHANGED
File without changes
|
2
試したコードの追記
test
CHANGED
File without changes
|
test
CHANGED
@@ -44,13 +44,45 @@
|
|
44
44
|
|
45
45
|
|
46
46
|
|
47
|
-
###
|
47
|
+
### 試したコード
|
48
48
|
|
49
|
+
```ここに言語を入力
|
50
|
+
|
51
|
+
html = requests.get(link)
|
52
|
+
|
53
|
+
soup = BeautifulSoup(html.content, 'html.parser')
|
54
|
+
|
55
|
+
elme = soup.find('div', class_='contents')
|
56
|
+
|
57
|
+
tbodies = elme.find_all('tbody')
|
58
|
+
|
59
|
+
pprint.pprint(tbodies) #tbodiesの確認
|
60
|
+
|
61
|
+
del tbodies[0]
|
62
|
+
|
63
|
+
pprint.pprint(tbodies) #0インデックスのリスト削除後のtbodiesの確認
|
64
|
+
|
65
|
+
```
|
66
|
+
|
49
|
-
|
67
|
+
上記のようにclass_='contents'を指定し、一度find_allでtbody情報をすべて取得し、その後 del リスト名[0]で1つ目のtbody情報を消してみました。
|
50
68
|
|
51
69
|
|
52
70
|
|
71
|
+
|
72
|
+
|
73
|
+
### 結果
|
74
|
+
|
75
|
+
```ここに言語を入力
|
76
|
+
|
77
|
+
[<tbody><tr>~~</tr><tr>~~</tr>・・・・</tr></tbody>,<tbody><tr>~~</tr><tr>~~</tr>・・・・</tr></tbody>]
|
78
|
+
|
79
|
+
[<tbody><tr>~~</tr><tr>~~</tr>・・・・</tr></tbody>]
|
80
|
+
|
81
|
+
```
|
82
|
+
|
83
|
+
|
84
|
+
|
53
|
-
|
85
|
+
結果は2つ目のtbody内の情報は取得できるものの1まとまりのstr型?となってしまい、trタグごとのリスト型として取得できておりません。
|
54
86
|
|
55
87
|
|
56
88
|
|
1
タグの追加
test
CHANGED
File without changes
|
test
CHANGED
File without changes
|