回答編集履歴
3
表現を修正
test
CHANGED
@@ -12,7 +12,7 @@
|
|
12
12
|
|
13
13
|
|
14
14
|
|
15
|
-
補足: このページのHTMLのmetaタグには、`charset=Shift_JIS`と書かれています。しかし、`pd.read_html`のエンコーディングに`Shift_JIS`を指定すると、質問文に含まれているようなエラーが発生します。
|
15
|
+
補足: このページのHTMLのmetaタグには、`charset=Shift_JIS`と書かれています。しかし、`pd.read_html`のエンコーディングに`Shift_JIS`を指定すると、(7つめの表の読み込み途中に中断されて`dfs[9]`は生成されず)質問文に含まれているようなエラーが発生します。
|
16
16
|
|
17
17
|
|
18
18
|
|
2
誤字を修正
test
CHANGED
@@ -12,7 +12,7 @@
|
|
12
12
|
|
13
13
|
|
14
14
|
|
15
|
-
|
15
|
+
補足: このページのHTMLのmetaタグには、`charset=Shift_JIS`と書かれています。しかし、`pd.read_html`のエンコーディングに`Shift_JIS`を指定すると、質問文に含まれているようなエラーが発生します。
|
16
16
|
|
17
17
|
|
18
18
|
|
1
補足を追加
test
CHANGED
@@ -9,3 +9,15 @@
|
|
9
9
|
+dfs = pd.read_html("http://2689web.com/1960/WD/WD10.html", encoding="cp932")
|
10
10
|
|
11
11
|
```
|
12
|
+
|
13
|
+
|
14
|
+
|
15
|
+
捕捉: このページのHTMLのmetaタグには、`charset=Shift_JIS`と書かれています。しかし、`pd.read_html`のエンコーディングに`Shift_JIS`を指定すると、質問文に含まれているようなエラーが発生します。
|
16
|
+
|
17
|
+
|
18
|
+
|
19
|
+
これは、選手名「蓜島」(はいじま)の「蓜」の字がIANA定義の`Shift_JIS`には含まれていないためです。この字は、Microsoftコードページ932(`cp932`)に追加された拡張漢字なので、正しく取り扱うにはエンコーディングに`cp932`を指定する必要があります。
|
20
|
+
|
21
|
+
|
22
|
+
|
23
|
+
[Microsoftコードページ932 - Wikipedia](https://ja.wikipedia.org/wiki/Microsoft%E3%82%B3%E3%83%BC%E3%83%89%E3%83%9A%E3%83%BC%E3%82%B8932)
|