回答編集履歴
1
Update
answer
CHANGED
|
@@ -1,26 +1,7 @@
|
|
|
1
|
-
`dd:nth-of-type(2)` にマッチさせるために HTML コードに `<dd></dd>` を追加しています。
|
|
2
|
-
|
|
3
|
-
```html
|
|
4
|
-
<div class="kanji">
|
|
5
|
-
<span class="text">鳩</span>
|
|
6
|
-
</div>
|
|
7
|
-
|
|
1
|
+
`stripped_strings` を使ってみました。
|
|
8
|
-
<dl>
|
|
9
|
-
<dt>訓読み</dt>
|
|
10
|
-
<dd></dd> <!-- Here -->
|
|
11
|
-
<dd> <span class="yomi">はと</span>・
|
|
12
|
-
<span class="yomi">あつ<span class="okurigana">める</span></span>・
|
|
13
|
-
<span class="yomi">あつ<span class="okurigana">まる</span></span>・
|
|
14
|
-
<span class="yomi">やす<span class="okurigana">んずる</span></span>
|
|
15
|
-
</dd>
|
|
16
|
-
</dl>
|
|
17
|
-
</div>
|
|
18
|
-
```
|
|
19
|
-
|
|
20
2
|
```python
|
|
21
|
-
x = soup.select('div.reads > dl > dd:nth-of-type(2) > span.yomi')
|
|
22
3
|
yomi_kun, okurigana = [], []
|
|
23
|
-
for i in
|
|
4
|
+
for i in soup.select('div.reads > dl > dd:nth-of-type(2) > span.yomi'):
|
|
24
5
|
ss = list(i.stripped_strings)
|
|
25
6
|
yomi_kun.append(ss[0])
|
|
26
7
|
okurigana.append(ss[1] if len(ss) > 1 else '')
|