質問編集履歴

2

追記しました

2017/05/30 00:55

投稿

rtakar
rtakar

スコア21

test CHANGED
File without changes
test CHANGED
@@ -50,7 +50,7 @@
50
50
 
51
51
 
52
52
 
53
- 追記:
53
+ ###追記:
54
54
 
55
55
  ```python
56
56
 

1

追記しました

2017/05/30 00:55

投稿

rtakar
rtakar

スコア21

test CHANGED
File without changes
test CHANGED
@@ -16,7 +16,9 @@
16
16
 
17
17
  ```python
18
18
 
19
+ # htmlのscriptに乗っているjsonデータをとってきています
20
+
19
- script = script.replace("window._sharedData = ", "")
21
+ script = soup.find_all("script", {"type": "text/javascript"})[1].get_text()
20
22
 
21
23
  data = json.dumps(script) # 確認用
22
24
 
@@ -45,3 +47,27 @@
45
47
  "{\"activity_counts\": null, ===hoge===
46
48
 
47
49
  ```
50
+
51
+
52
+
53
+ 追記:
54
+
55
+ ```python
56
+
57
+ print(json.loads(data)) # 確認用
58
+
59
+ ```
60
+
61
+
62
+
63
+ ```python
64
+
65
+ print(data) # 確認用
66
+
67
+
68
+
69
+ ```
70
+
71
+ に変更したところ、output.jsonと同じ形になりました。
72
+
73
+ jsonの形として不要な「\」や「”」などを除去したいのですが、原因と方法が知りたいです