前提・実現したいこと
以下のように複数のtrタグで囲まれたhtmlがあるとします。
<tr> <th><a href="http://www.spec.org/auto/cpu2017/Docs/result-fields.html#CPUName">CPU Name</a>:</th> <td>Intel Xeon Gold 6154</td> </tr>, <tr> <th><a href="http://www.spec.org/auto/cpu2017/Docs/result-fields.html#MaxMHz">Max MHz.</a>:</th> <td>3700</td> </tr>, <tr> <th><a href="http://www.spec.org/auto/cpu2017/Docs/result-fields.html#Nominal">Nominal</a>:</th> <td>3000</td> </tr>,
beautifulsoupを使って、tdの中身を取得し、以下のようなリストを作りたいです。
CPU Name(th)の中のtdの値→Max MHz.(th)の中のtdの値→Nominal(th)の中のtdの値と順番は守って格納したいので、thがCPU Nameであればその下の要素のtdの'Intel Xeon Gold 6154'を取得するようにしたいのですがどのようにすればいいでしょうか。(thが存在しない行もまれにあります)
list = ['Intel Xeon Gold 6154', '3700', '3000']
補足情報(FW/ツールのバージョンなど)
CentOS 7
python 3.6
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2020/03/25 13:43