スクレイピング初心者です。教えてください。
基礎的な本を読んで次のようなhtmlタグの中身を取得する方法は理解しました。
<a>15m</a>, <a>100kg</a>
これは次のようにして2つの要素が取り出せました。
result=find_all("a") result[0].string result[1].string 実行結果-- 15m 100kg
しかしいざ実践しようとしたところ、入れ子(?)となっている要素がうまく取り出せません。
<a>15m<sup>2</sup></a>, <a>100kg</a>
同じように書くと、、
result=find_all("a") result[0].string result[1].string 実行結果-- None 100kg
となってしまいます。
<a>の中に<sup>があるからだと思うのですが。。
スマートな取り出し方を教えてください。

回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2018/02/11 09:47