質問編集履歴
1
いただいた追記依頼に対応
test
CHANGED
File without changes
|
test
CHANGED
@@ -45,3 +45,17 @@
|
|
45
45
|
beautifulsoupで,shift-jisのhtmlを解析する方法を教えていただきたいです。色々と調べてはみたのですが,どのようにやってもエラーが出てしまいます。
|
46
46
|
|
47
47
|
もしくは,shift-jisのhtmlをutf-8を変換する方法を教えていただきたいです。こちらも調べてはみたのですが,実装には至りませんでした。
|
48
|
+
|
49
|
+
|
50
|
+
|
51
|
+
#追加・補充
|
52
|
+
|
53
|
+
以下のコードを試したところ,同様のエラーが出てしまいました。
|
54
|
+
|
55
|
+
```ここに言語を入力
|
56
|
+
|
57
|
+
soup = bs(open(file1, 'rb').read().decode('Shift-JIS'), 'lxml')
|
58
|
+
|
59
|
+
```
|
60
|
+
|
61
|
+
'shift_jis' codec can't decode byte 0x87 in position 2020: illegal multibyte sequence
|