GithubAPIを使ってレポジトリにあるwordファイルの文字数などを取り出したいのですがデコード部分でエラーが出ます。文字コード関連のエラーだとは思うのですがそもそもwordファイルのバイナリデータからデコードして文字数や内容を取ってくることは可能なのですか?
python3
1from github import Github 2import base64 3import codecs 4 5token = 'hoge' 6repo_name = 'hogerepo' 7file_name = 'hoge.docx' 8 9g = Github(token) 10repo = g.get_repo(repo_name) 11contents = repo.get_contents(file_name)) 12content = base64.b64decode(contents.content) 13with open(file_name, mode="rb") as f: 14 content = f.read() 15 tmp = content.decode()
Error
1Traceback (most recent call last): 2 File "C:\Users\riku\Desktop\portforio\soturonproject\pygit.py", line 20, in <module> 3 print(content.decode()) 4UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd2 in position 16: invalid continuation byte
回答3件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。