質問編集履歴

1

試したことを更新

2019/04/18 23:29

投稿

p1kas0
p1kas0

スコア17

test CHANGED
File without changes
test CHANGED
@@ -11,8 +11,6 @@
11
11
  取得した中身を見たところ実際のページの構造と違うように見えるのですが、ちゃんと抽出するためには
12
12
 
13
13
  どのようにすればよいでしょうか。
14
-
15
- ページ構造はchromeの検証、ページのソースを見る両方に目当ての記述があるのを確認してます。
16
14
 
17
15
 
18
16
 
@@ -43,3 +41,35 @@
43
41
  html = bs(response.text, "lxml")
44
42
 
45
43
  ```
44
+
45
+
46
+
47
+ ### 試したこと
48
+
49
+
50
+
51
+ ```
52
+
53
+
54
+
55
+ ページ構造はchromeの「検証」、「ページのソースを表示」両方に目当ての記述があるのを確認してます。
56
+
57
+
58
+
59
+ html = bs(response.text, "html.parser")
60
+
61
+ html = bs(response.text, "lxml-xml")
62
+
63
+ html = bs(response.text, "html5lib")
64
+
65
+
66
+
67
+ →パースの仕方かと思って色々試しましたが、そもそもresponse.textの状態で
68
+
69
+ 抽出したい項目が入ってませんでした。
70
+
71
+
72
+
73
+
74
+
75
+ ```