<h1 class="mainvisual_title">あいうえお</h1> <p class="mainvisual_category">かきくけこ</p>
あるwebサイトの「あいうえお」「かきくけを」を抜き取りたいのですが、titleからxpathをコピーすると順番が逆になり余計なものが入ってきてしまう為、
copy selectorで試してみました。
print(soup.select("#wrap > div.contents.entries_wrap > div.main.js-contents-top > div.mainvisual._a.pb60 > div > div.mainvisual_main > p.mainvisual_category")) print(soup.select("#wrap > div.contents.entries_wrap > div.main.js-contents-top > div.mainvisual._a.pb60 > div > div.mainvisual_main > h1"))
結果、以下のように希望通り文字は抜き取れたのですが、
<p class="mainvisual_category">と[<h1 class="mainvisual_title">が不要です。[<p class="mainvisual_category">あいうえお</p>] [<h1 class="mainvisual_title">かきくけこ</h1>]
いろいろ試してもうまくいかないので、詳しい方、ご教示いただきたくよろしくお願いいたします。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
退会済みユーザー
2019/03/20 04:52
退会済みユーザー
2019/03/21 05:30