teratail header banner
teratail header banner
質問するログイン新規登録

質問編集履歴

2

追記しました

2017/05/30 00:55

投稿

rtakar
rtakar

スコア21

title CHANGED
File without changes
body CHANGED
@@ -24,7 +24,7 @@
24
24
  "{\"activity_counts\": null, ===hoge===
25
25
  ```
26
26
 
27
- 追記:
27
+ ###追記:
28
28
  ```python
29
29
  print(json.loads(data)) # 確認用
30
30
  ```

1

追記しました

2017/05/30 00:55

投稿

rtakar
rtakar

スコア21

title CHANGED
File without changes
body CHANGED
@@ -7,7 +7,8 @@
7
7
  ファイルとして出力すると余計な記号がついてしまいます。
8
8
  これ正しく出力したいのですが、何が原因なのでしょうか
9
9
  ```python
10
+ # htmlのscriptに乗っているjsonデータをとってきています
10
- script = script.replace("window._sharedData = ", "")
11
+ script = soup.find_all("script", {"type": "text/javascript"})[1].get_text()
11
12
  data = json.dumps(script) # 確認用
12
13
  print(json.loads(data)) # 確認用
13
14
  with open("Output.json", "w") as f:
@@ -21,4 +22,16 @@
21
22
  ```
22
23
  # json.dumpsの時の出力Output.json
23
24
  "{\"activity_counts\": null, ===hoge===
24
- ```
25
+ ```
26
+
27
+ 追記:
28
+ ```python
29
+ print(json.loads(data)) # 確認用
30
+ ```
31
+
32
+ ```python
33
+ print(data) # 確認用
34
+
35
+ ```
36
+ に変更したところ、output.jsonと同じ形になりました。
37
+ jsonの形として不要な「\」や「”」などを除去したいのですが、原因と方法が知りたいです