質問編集履歴

5

a

2019/08/11 05:40

投稿

sku_gh
sku_gh

スコア8

test CHANGED
File without changes
test CHANGED
@@ -26,7 +26,7 @@
26
26
 
27
27
  ・windows10
28
28
 
29
- ・python3.7
29
+ ・python3.7.4
30
30
 
31
31
  ・visual studio code使用
32
32
 

4

追記

2019/08/11 05:40

投稿

sku_gh
sku_gh

スコア8

test CHANGED
File without changes
test CHANGED
@@ -29,6 +29,8 @@
29
29
  ・python3.7
30
30
 
31
31
  ・visual studio code使用
32
+
33
+ ・コマンドプロンプトにて実行
32
34
 
33
35
 
34
36
 

3

環境

2019/08/11 05:39

投稿

sku_gh
sku_gh

スコア8

test CHANGED
File without changes
test CHANGED
@@ -21,6 +21,16 @@
21
21
 
22
22
 
23
23
  ### 追記です(説明不足で申し訳ありません)
24
+
25
+ 環境
26
+
27
+ ・windows10
28
+
29
+ ・python3.7
30
+
31
+ ・visual studio code使用
32
+
33
+
24
34
 
25
35
  まず、もともとやりたかったのはwebスクレイピングです。webページのソース内にに下記のようなjsがありました。
26
36
 

2

追記

2019/08/11 05:38

投稿

sku_gh
sku_gh

スコア8

test CHANGED
File without changes
test CHANGED
@@ -17,3 +17,73 @@
17
17
  ```
18
18
 
19
19
  エラーが出てしまいます。どうすればうまく変換できるのでしょうか?
20
+
21
+
22
+
23
+ ### 追記です(説明不足で申し訳ありません)
24
+
25
+ まず、もともとやりたかったのはwebスクレイピングです。webページのソース内にに下記のようなjsがありました。
26
+
27
+ ```javascript
28
+
29
+ window.content_Data_k = {
30
+
31
+ "config": {
32
+
33
+ "token": "dsf78sadf9sdfasd7s9df7safd6",
34
+
35
+ "seer": null,
36
+
37
+ "seerId": null
38
+
39
+ },
40
+
41
+ "country_code": "JP",
42
+
43
+ "language_code": "ja",
44
+
45
+ "locale": "ja_JP",
46
+
47
+ "index_data": {
48
+
49
+ "contentPage": [{
50
+
51
+ "logging_page_id": "contentPage_728394298",
52
+
53
+ "show_suggested_contents": false,
54
+
55
+ "graphql": {
56
+
57
+ "user": {
58
+
59
+ "name": "aaa",
60
+
61
+ "comment":"\u9577\u5d0e\u51fa\u8eab\u3067\u3059\ud83d\udd4a",
62
+
63
+ "block": false,
64
+
65
+ "country_block": false,
66
+
67
+ "expect_url": null,
68
+
69
+ "expect_url_linkshimmed": null,
70
+
71
+ "key_number": {
72
+
73
+ "count": 13
74
+
75
+ }
76
+
77
+ }
78
+
79
+ }
80
+
81
+ }]
82
+
83
+ }
84
+
85
+ }
86
+
87
+ ```
88
+
89
+ この中から"\u9577\u5d0e\u51fa\u8eab\u3067\u3059\ud83d\udd4a"の部分を取得したかったので、```comment = re.search(r'"comment"\s*:\s*"([^"]*)"',page_source).group(1)```として取得しました。引数page_sourceにはrequestsライブラリで取得した、webページのソースすべてが代入されています。最後に```print(comment)```すると、```\u9577\u5d0e\u51fa\u8eab\u3067\u3059\ud83d\udd4a```がそのまま表示されてしまうわけです。

1

書式の改善

2019/08/11 05:35

投稿

sku_gh
sku_gh

スコア8

test CHANGED
File without changes
test CHANGED
@@ -2,7 +2,7 @@
2
2
 
3
3
  ```python
4
4
 
5
- u9577\u5d0e\u51fa\u8eab\u3067\u3059\ud83d\udd4a
5
+ \u9577\u5d0e\u51fa\u8eab\u3067\u3059\ud83d\udd4a
6
6
 
7
7
  ```
8
8