回答編集履歴

3

表現を修正

2021/08/27 12:30

投稿

Daregada
Daregada

スコア11990

test CHANGED
@@ -12,7 +12,7 @@
12
12
 
13
13
 
14
14
 
15
- 補足: このページのHTMLのmetaタグには、`charset=Shift_JIS`と書かれています。しかし、`pd.read_html`のエンコーディングに`Shift_JIS`を指定すると、質問文に含まれているようなエラーが発生します。
15
+ 補足: このページのHTMLのmetaタグには、`charset=Shift_JIS`と書かれています。しかし、`pd.read_html`のエンコーディングに`Shift_JIS`を指定すると、(7つめの表の読み込み途中に中断されて`dfs[9]`は生成されず)質問文に含まれているようなエラーが発生します。
16
16
 
17
17
 
18
18
 

2

誤字を修正

2021/08/27 12:30

投稿

Daregada
Daregada

スコア11990

test CHANGED
@@ -12,7 +12,7 @@
12
12
 
13
13
 
14
14
 
15
- 捕捉: このページのHTMLのmetaタグには、`charset=Shift_JIS`と書かれています。しかし、`pd.read_html`のエンコーディングに`Shift_JIS`を指定すると、質問文に含まれているようなエラーが発生します。
15
+ 補足: このページのHTMLのmetaタグには、`charset=Shift_JIS`と書かれています。しかし、`pd.read_html`のエンコーディングに`Shift_JIS`を指定すると、質問文に含まれているようなエラーが発生します。
16
16
 
17
17
 
18
18
 

1

補足を追加

2021/08/27 12:23

投稿

Daregada
Daregada

スコア11990

test CHANGED
@@ -9,3 +9,15 @@
9
9
  +dfs = pd.read_html("http://2689web.com/1960/WD/WD10.html", encoding="cp932")
10
10
 
11
11
  ```
12
+
13
+
14
+
15
+ 捕捉: このページのHTMLのmetaタグには、`charset=Shift_JIS`と書かれています。しかし、`pd.read_html`のエンコーディングに`Shift_JIS`を指定すると、質問文に含まれているようなエラーが発生します。
16
+
17
+
18
+
19
+ これは、選手名「蓜島」(はいじま)の「蓜」の字がIANA定義の`Shift_JIS`には含まれていないためです。この字は、Microsoftコードページ932(`cp932`)に追加された拡張漢字なので、正しく取り扱うにはエンコーディングに`cp932`を指定する必要があります。
20
+
21
+
22
+
23
+ [Microsoftコードページ932 - Wikipedia](https://ja.wikipedia.org/wiki/Microsoft%E3%82%B3%E3%83%BC%E3%83%89%E3%83%9A%E3%83%BC%E3%82%B8932)