UnicodeDecodeError: 'utf-8' codec can't decode byte 0x89 in position 0: invalid start byte
受付中
回答 1
投稿
- 評価
- クリップ 0
- VIEW 29K+
Salesforceの添付データを取得し、新規フォルダを作成ご保存数するプログラムを作っているのですが、下記のエラーを解決できず詰まっています。
File "autotmp.py", line 50, in <module>
resp = sfdc.get(urlpath).decode('utf-8')
File "/usr/local/lib/python3.5/dist-packages/salesforce/api.py", line 49, in get
return self.get_api(soap).get(get_url, params)
File "/home/dbcon/utils.py", line 188, in authenticate_and_call
return func(self, *args, kwargs)
File "/home/dbcon/salesforceRestApi.py", line 104, in get
params=params)
File "/home/dbcon/salesforceRestApi.py", line 137, in send_request
**kwargs)
File "/home/dbcon/utils.py", line 159, in send_request
resp = response.json()
File "/usr/lib/python3/dist-packages/requests/models.py", line 740, in json
return json.loads(self.content.decode(encoding), kwargs)
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x89 in position 0: invalid start byte
どなたか解決策を教えていただけないでしょうか。
宜しくお願いします。
#!/usr/bin/env python
# -*- coding: utf-8 -*-
#Automatically download attached files from records
#To download multiple files as zip use:
# https://fsi-america-dev-ed.my.salesforce.com/sfc/servlet.shepherd/document/download/<id>/<id>/...
import salesforce as sf
import os
import urllib.request
sfdc = sf.Salesforce()
sfdc.authenticate(client_id=client_id,client_secret=client_secret,username=username,password=password)
#get api sobjects
api_objects = []
urlpath = "/sobjects/"
resp = sfdc.get(urlpath,'utf-8')
for record in resp["sobjects"]:
api_objects.append(record["name"])
#get id, filename from contentversion
version = {}
query_results = sfdc.query("SELECT Id, ContentDocumentId, Title, FileExtension FROM ContentVersion")
for record in query_results["records"]:
if record["ContentDocumentId"] not in version:
version[record["ContentDocumentId"]] = []
version[record["ContentDocumentId"]].append({"Id":record["Id"],"Filename":record["Title"] + "." + record["FileExtension"]})
#download
for api_object in api_objects:
print("processing:" + api_object, 'utf-8')
query_results = None
try:
query_results = sfdc.query("SELECT Id, ContentDocumentId, LinkedEntityId FROM ContentDocumentLink where LinkedEntityId in (SELECT Id FROM " + api_object + ")")
except:
continue
for record in query_results["records"]:
if record["ContentDocumentId"] in version:
vlist = version[record["ContentDocumentId"]]
for v in vlist:
print(" downloading:" + v["Id"], 'utf-8')
urlpath = "/sobjects/ContentVersion/" + v["Id"] + "/VersionData"
filepath = base_folder + api_object + "/" + record["LinkedEntityId"] + "/" + v["Filename"]
resp = sfdc.get(urlpath, 'utf-8')
os.makedirs(os.path.dirname(filepath), exist_ok=True)
with open(filepath, "wb", encoding='utf-8') as f:
f.write(resp.content)
-
気になる質問をクリップする
クリップした質問は、後からいつでもマイページで確認できます。
またクリップした質問に回答があった際、通知やメールを受け取ることができます。
クリップを取り消します
-
良い質問の評価を上げる
以下のような質問は評価を上げましょう
- 質問内容が明確
- 自分も答えを知りたい
- 質問者以外のユーザにも役立つ
評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。
質問の評価を上げたことを取り消します
-
評価を下げられる数の上限に達しました
評価を下げることができません
- 1日5回まで評価を下げられます
- 1日に1ユーザに対して2回まで評価を下げられます
質問の評価を下げる
teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。
- プログラミングに関係のない質問
- やってほしいことだけを記載した丸投げの質問
- 問題・課題が含まれていない質問
- 意図的に内容が抹消された質問
- 過去に投稿した質問と同じ内容の質問
- 広告と受け取られるような投稿
評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。
質問の評価を下げたことを取り消します
この機能は開放されていません
評価を下げる条件を満たしてません
質問の評価を下げる機能の利用条件
この機能を利用するためには、以下の事項を行う必要があります。
- 質問回答など一定の行動
-
メールアドレスの認証
メールアドレスの認証
-
質問評価に関するヘルプページの閲覧
質問評価に関するヘルプページの閲覧
+1
Salesforce が返しているデータが、UTF-8 ではない(おそらくは Shift-JIS)からでしょう。
エラーメッセージは、「UTF-8 としてデコードしようとしたバイト列の先頭が 0x89 であり、UTF-8 にマッピングできない」と言っているのです。
※UTF-8 の文字の先頭バイトは00-7F, C2-FD のいずれかで、80~C1 までが来ることはありません
まずは
resp = sfdc.get(urlpath,'utf-8')
ここでエンコードを指定せずに取得した結果をバイナリダンプでもして、文字コードを確認してください。
投稿
-
回答の評価を上げる
以下のような回答は評価を上げましょう
- 正しい回答
- わかりやすい回答
- ためになる回答
評価が高い回答ほどページの上位に表示されます。
-
回答の評価を下げる
下記のような回答は推奨されていません。
- 間違っている回答
- 質問の回答になっていない投稿
- スパムや攻撃的な表現を用いた投稿
評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。
15分調べてもわからないことは、teratailで質問しよう!
- ただいまの回答率 88.32%
- 質問をまとめることで、思考を整理して素早く解決
- テンプレート機能で、簡単に質問をまとめられる
質問への追記・修正、ベストアンサー選択の依頼
coco_bauer
2018/06/15 17:03
取得した「Salesforceの添付データ」の文字コードが、UTF-8ではないのでは?