質問編集履歴

1

いただいた追記依頼に対応

2021/11/25 02:25

投稿

退会済みユーザー
test CHANGED
File without changes
test CHANGED
@@ -45,3 +45,17 @@
45
45
  beautifulsoupで,shift-jisのhtmlを解析する方法を教えていただきたいです。色々と調べてはみたのですが,どのようにやってもエラーが出てしまいます。
46
46
 
47
47
  もしくは,shift-jisのhtmlをutf-8を変換する方法を教えていただきたいです。こちらも調べてはみたのですが,実装には至りませんでした。
48
+
49
+
50
+
51
+ #追加・補充
52
+
53
+ 以下のコードを試したところ,同様のエラーが出てしまいました。
54
+
55
+ ```ここに言語を入力
56
+
57
+ soup = bs(open(file1, 'rb').read().decode('Shift-JIS'), 'lxml')
58
+
59
+ ```
60
+
61
+ 'shift_jis' codec can't decode byte 0x87 in position 2020: illegal multibyte sequence