###前提・実現したいこと
以下のようなhtmlのdataをpythonを使って処理しようとしています。モジュールはlxmlをiportして扱おうとしています
html
1<div class='a'><img src='aa.jpg'></div> 2<div class='b'><img src='ab.jpg'></div> 3<div class='b'><img src='ac.jpg'></div> 4<div class='b'><img src='ad.jpg'></div> 5<div class='a'><img src='ba.jpg'></div> 6<div class='b'><img src='bb.jpg'></div> 7<div class='b'><img src='bc.jpg'></div>
これを
html
1<div class='a'><img src='aa.jpg'> 2<img src='ab.jpg'> 3<img src='ac.jpg'> 4<img src='ad.jpg'></div> 5<div class='a'><img src='ba.jpg'> 6<img src='bb.jpg'> 7<img src='bc.jpg'></div>
のように変換したいと思っています
###やったこと
find('.//div[@class="b"]') でサーチして子要素をclass='a'の配下にappendしようととしたのですが直前のclass='a'の位置をどうすれば取得できるのかがわからず、断念してしまいました。
このような場合はそもそも上のやり方であっているのか、それとも他にスマートなやり方があるのか、lxmlの操作に不慣れなため判断ができません
なにか良い方法があればよろしくお願いします
![guest](/img/icon/icnUserSample.jpg)
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2016/07/20 03:50
2016/07/20 05:04
2016/07/20 06:05