質問編集履歴
1
試したことを更新
test
CHANGED
File without changes
|
test
CHANGED
@@ -11,8 +11,6 @@
|
|
11
11
|
取得した中身を見たところ実際のページの構造と違うように見えるのですが、ちゃんと抽出するためには
|
12
12
|
|
13
13
|
どのようにすればよいでしょうか。
|
14
|
-
|
15
|
-
ページ構造はchromeの検証、ページのソースを見る両方に目当ての記述があるのを確認してます。
|
16
14
|
|
17
15
|
|
18
16
|
|
@@ -43,3 +41,35 @@
|
|
43
41
|
html = bs(response.text, "lxml")
|
44
42
|
|
45
43
|
```
|
44
|
+
|
45
|
+
|
46
|
+
|
47
|
+
### 試したこと
|
48
|
+
|
49
|
+
|
50
|
+
|
51
|
+
```
|
52
|
+
|
53
|
+
|
54
|
+
|
55
|
+
ページ構造はchromeの「検証」、「ページのソースを表示」両方に目当ての記述があるのを確認してます。
|
56
|
+
|
57
|
+
|
58
|
+
|
59
|
+
html = bs(response.text, "html.parser")
|
60
|
+
|
61
|
+
html = bs(response.text, "lxml-xml")
|
62
|
+
|
63
|
+
html = bs(response.text, "html5lib")
|
64
|
+
|
65
|
+
|
66
|
+
|
67
|
+
→パースの仕方かと思って色々試しましたが、そもそもresponse.textの状態で
|
68
|
+
|
69
|
+
抽出したい項目が入ってませんでした。
|
70
|
+
|
71
|
+
|
72
|
+
|
73
|
+
|
74
|
+
|
75
|
+
```
|