質問編集履歴
5
a
test
CHANGED
File without changes
|
test
CHANGED
@@ -26,7 +26,7 @@
|
|
26
26
|
|
27
27
|
・windows10
|
28
28
|
|
29
|
-
・python3.7
|
29
|
+
・python3.7.4
|
30
30
|
|
31
31
|
・visual studio code使用
|
32
32
|
|
4
追記
test
CHANGED
File without changes
|
test
CHANGED
@@ -29,6 +29,8 @@
|
|
29
29
|
・python3.7
|
30
30
|
|
31
31
|
・visual studio code使用
|
32
|
+
|
33
|
+
・コマンドプロンプトにて実行
|
32
34
|
|
33
35
|
|
34
36
|
|
3
環境
test
CHANGED
File without changes
|
test
CHANGED
@@ -21,6 +21,16 @@
|
|
21
21
|
|
22
22
|
|
23
23
|
### 追記です(説明不足で申し訳ありません)
|
24
|
+
|
25
|
+
環境
|
26
|
+
|
27
|
+
・windows10
|
28
|
+
|
29
|
+
・python3.7
|
30
|
+
|
31
|
+
・visual studio code使用
|
32
|
+
|
33
|
+
|
24
34
|
|
25
35
|
まず、もともとやりたかったのはwebスクレイピングです。webページのソース内にに下記のようなjsがありました。
|
26
36
|
|
2
追記
test
CHANGED
File without changes
|
test
CHANGED
@@ -17,3 +17,73 @@
|
|
17
17
|
```
|
18
18
|
|
19
19
|
エラーが出てしまいます。どうすればうまく変換できるのでしょうか?
|
20
|
+
|
21
|
+
|
22
|
+
|
23
|
+
### 追記です(説明不足で申し訳ありません)
|
24
|
+
|
25
|
+
まず、もともとやりたかったのはwebスクレイピングです。webページのソース内にに下記のようなjsがありました。
|
26
|
+
|
27
|
+
```javascript
|
28
|
+
|
29
|
+
window.content_Data_k = {
|
30
|
+
|
31
|
+
"config": {
|
32
|
+
|
33
|
+
"token": "dsf78sadf9sdfasd7s9df7safd6",
|
34
|
+
|
35
|
+
"seer": null,
|
36
|
+
|
37
|
+
"seerId": null
|
38
|
+
|
39
|
+
},
|
40
|
+
|
41
|
+
"country_code": "JP",
|
42
|
+
|
43
|
+
"language_code": "ja",
|
44
|
+
|
45
|
+
"locale": "ja_JP",
|
46
|
+
|
47
|
+
"index_data": {
|
48
|
+
|
49
|
+
"contentPage": [{
|
50
|
+
|
51
|
+
"logging_page_id": "contentPage_728394298",
|
52
|
+
|
53
|
+
"show_suggested_contents": false,
|
54
|
+
|
55
|
+
"graphql": {
|
56
|
+
|
57
|
+
"user": {
|
58
|
+
|
59
|
+
"name": "aaa",
|
60
|
+
|
61
|
+
"comment":"\u9577\u5d0e\u51fa\u8eab\u3067\u3059\ud83d\udd4a",
|
62
|
+
|
63
|
+
"block": false,
|
64
|
+
|
65
|
+
"country_block": false,
|
66
|
+
|
67
|
+
"expect_url": null,
|
68
|
+
|
69
|
+
"expect_url_linkshimmed": null,
|
70
|
+
|
71
|
+
"key_number": {
|
72
|
+
|
73
|
+
"count": 13
|
74
|
+
|
75
|
+
}
|
76
|
+
|
77
|
+
}
|
78
|
+
|
79
|
+
}
|
80
|
+
|
81
|
+
}]
|
82
|
+
|
83
|
+
}
|
84
|
+
|
85
|
+
}
|
86
|
+
|
87
|
+
```
|
88
|
+
|
89
|
+
この中から"\u9577\u5d0e\u51fa\u8eab\u3067\u3059\ud83d\udd4a"の部分を取得したかったので、```comment = re.search(r'"comment"\s*:\s*"([^"]*)"',page_source).group(1)```として取得しました。引数page_sourceにはrequestsライブラリで取得した、webページのソースすべてが代入されています。最後に```print(comment)```すると、```\u9577\u5d0e\u51fa\u8eab\u3067\u3059\ud83d\udd4a```がそのまま表示されてしまうわけです。
|
1
書式の改善
test
CHANGED
File without changes
|
test
CHANGED
@@ -2,7 +2,7 @@
|
|
2
2
|
|
3
3
|
```python
|
4
4
|
|
5
|
-
u9577\u5d0e\u51fa\u8eab\u3067\u3059\ud83d\udd4a
|
5
|
+
\u9577\u5d0e\u51fa\u8eab\u3067\u3059\ud83d\udd4a
|
6
6
|
|
7
7
|
```
|
8
8
|
|