回答率: 85.48%

質問するログイン新規登録

トップに関する質問 reライブラリのsearchで取得した文字列がdecodeできない

編集履歴

質問編集履歴

5

a

2019/08/11 05:40

投稿

スコア8

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -26,7 +26,7 @@
 ・windows10
-・python3.7
+・python3.7.4
 ・visual studio code使用

4

追記

2019/08/11 05:40

投稿

スコア8

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -29,6 +29,8 @@
 ・python3.7
 ・visual studio code使用
+・コマンドプロンプトにて実行

3

環境

2019/08/11 05:39

投稿

スコア8

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -21,6 +21,16 @@
 ### 追記です（説明不足で申し訳ありません）
+環境
+・windows10
+・python3.7
+・visual studio code使用
 まず、もともとやりたかったのはwebスクレイピングです。webページのソース内にに下記のようなjsがありました。

2

追記

2019/08/11 05:38

投稿

スコア8

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -17,3 +17,73 @@
 ```
 エラーが出てしまいます。どうすればうまく変換できるのでしょうか？
+### 追記です（説明不足で申し訳ありません）
+まず、もともとやりたかったのはwebスクレイピングです。webページのソース内にに下記のようなjsがありました。
+```javascript
+window.content_Data_k = {
+	"config": {
+		"token": "dsf78sadf9sdfasd7s9df7safd6",
+		"seer": null,
+		"seerId": null
+	},
+	"country_code": "JP",
+	"language_code": "ja",
+	"locale": "ja_JP",
+	"index_data": {
+		"contentPage": [{
+			"logging_page_id": "contentPage_728394298",
+			"show_suggested_contents": false,
+			"graphql": {
+				"user": {
+					"name": "aaa",
+					"comment":"\u9577\u5d0e\u51fa\u8eab\u3067\u3059\ud83d\udd4a",
+					"block": false,
+					"country_block": false,
+					"expect_url": null,
+					"expect_url_linkshimmed": null,
+					"key_number": {
+						"count": 13
+                    }
+                }
+            }
+        }]
+    }
+}
+```
+この中から"\u9577\u5d0e\u51fa\u8eab\u3067\u3059\ud83d\udd4a"の部分を取得したかったので、```comment = re.search(r'"comment"\s*:\s*"([^"]*)"',page_source).group(1)```として取得しました。引数page_sourceにはrequestsライブラリで取得した、webページのソースすべてが代入されています。最後に```print(comment)```すると、```\u9577\u5d0e\u51fa\u8eab\u3067\u3059\ud83d\udd4a```がそのまま表示されてしまうわけです。

1

書式の改善

2019/08/11 05:35

投稿

スコア8

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -2,7 +2,7 @@
 ```python
-u9577\u5d0e\u51fa\u8eab\u3067\u3059\ud83d\udd4a
+\u9577\u5d0e\u51fa\u8eab\u3067\u3059\ud83d\udd4a
 ```

【募集】

teratailを一緒に作りたいエンジニア

サービス紹介

teratailとは？公式ブログバッジとは?運営からのお知らせ称号とは?teratail API タグ一覧ヘルプユーザーランキングお役立ちコンテンツ

関連サービス

フリーランスエンジニア支援レバテックフリーランスフリーランスクリエイター支援レバテッククリエイターエンジニア新卒就職レバテックルーキー大学生/大学院生向けプログラミングスクールレバテックカレッジエンジニア転職エージェントレバテックキャリアスカウト機能付き求人メディアレバテックダイレクトキャリアと技術の可能性が見つかるメディアレバテックLAB

回答は行っておりません

返信の必要なお問い合わせはこちら

運営会社利用規約行動規範個人情報の取り扱い個人情報保護方針広告掲載のお問い合わせ

レバレジーズグループ関連サービス

レバテックレバテックフリーランスレバテッククリエイターレバテックキャリアレバテックダイレクトレバテックルーキーレバテックカレッジ teratail レバテックプラットフォームフリーランスHub レバテック（フリーランス向けサービス紹介）レバテック（正社員転職サービス紹介）

キャリアチケットキャリアチケットカフェキャリアチケットスカウトハタラクティブハタラクティブプラスワークリアレバレジーズM&Aアドバイザリーレバクリレバウェルレバウェル介護レバウェル看護レバウェル保育士レバウェル医療技師レバウェルリハビリレバウェル栄養士レバウェル医師レバウェル薬剤師レバレジーズメディカルケアわんコネ WeXpats Leverages Global Support Leverages Global（上海）レバレジーズキャリアメキシコ

© 2014-2024 Leverages Co., Ltd.