pythonのスクレイピングでタグは違うけどclassは一緒の場合のスクレイピング方法が分かりません。
例えば
質問内容のコード例だと、全要素でclassも違っています。
そのため質問の文との内容齟齬が起きています。
内容の確認と必要に応じて補足等をお願いします。
早速のご返信ありがとうございました。
すいません。全要素が違うのは理解ができるのですがclassが違うとはどういう意味でしょうか?
↑への返信の前に念のため確認したいのですが、質問文にあるclassは何を指していますか?この内容だと2通りの解釈ができるのですが、
1. HTMLとしてのclass属性の中身
2. Python側のコードのclass
3. その他、上記とは関係ない何か
最初の追記・修正依頼は(1)の解釈を前提にしています。
例示されているHTML相当のものは、実体としては
<li class="A">www</li>
<span class="B">xxx</span>
<h1 class="C">yyy</h1>
<ul class="D">zzz</ul>
という形態になるのですが、各要素のclassはそれぞれ、A・B・C・Dとなっておりバラバラです。
(少なくとも「一緒」という表現にはならないと思っています)
HTMLとしてのclass属性の中身となっております
<li class="A">〇〇</li>
<span class="B">〇〇</span>
<h1 class="C">〇〇</h1>
<ul class="D">〇〇</ul>
となっております。
大変失礼いたしました。
あなたの言う「classは一緒の場合」とは具体的にどんな意味ですか?
例えば『<li class="A"><a href="〇〇">123</a></li>』や『<span class="B">456<br class="C">789</span>』です。
class(属性)を指定して要素(ここで言う『123』と『456』と『789』)を取得したいんです
「classは一緒」というのは一般的には「class属性の値は同じ」という意味なのですが、
あなたの言う「一緒」とは一般的な日本語でどういう意味ですか?
私の言う一緒とは「classという入れ物の名前が一緒」という意味です。属性値は違います。
「classという入れ物の名前が一緒」というのは、「どれにもclass属性がある」という意味ですかね?
属性値は不問で、class属性が有りさえすればいいと言うこと?
「どれにもclass属性がある」という意味です。←訂正しました。すいません。
情報はこの欄にてはなく質問を編集して記載してください
質問は意図がわかるように編集しておいてください。
quickquipさん>編集しましたがこれでいかがでしょうか?