🎄teratailクリスマスプレゼントキャンペーン2024🎄』開催中!

\teratail特別グッズやAmazonギフトカード最大2,000円分が当たる!/

詳細はこちら
スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

selenium

Selenium(セレニウム)は、ブラウザをプログラムで作動させるフレームワークです。この原理を使うことにより、ブラウザのユーザーテストなどを自動化にすることができます。

Q&A

解決済

1回答

506閲覧

SeleniumBasicでHTMLのElementを番号等で管理する手段について

shin_0123

総合スコア5

スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

selenium

Selenium(セレニウム)は、ブラウザをプログラムで作動させるフレームワークです。この原理を使うことにより、ブラウザのユーザーテストなどを自動化にすることができます。

0グッド

0クリップ

投稿2021/01/28 02:19

実現したいこと

SeleniumBasic + Chromでスクレイピングのプログラムを
作っています。
この時HTMLのElementを番号等でFindする手段は
ない物でしょうか?!

複数の商品がリスト化されている
ページから「商品名、価格、送料」等を取得したいのです。
例)https://ebay.to/3ol82Tb

試してみた事

今はFindElementsByTag等でFindをかけていますが、
複数のTagで別々にFindすると、商品名と値段にズレが
出てしまったりして苦労しています。

実現できると嬉しい事

そこで、最初に商品名だけはFindElementsByTagで
抑えて、そこから先は例えば次のINDEX?!番号等で
追いかけて行ければ、間違いはないと思えるのです。

もし、他にいいアイデアがあれば含めてご教示頂けますと
幸いです

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

Xpath から 軸・ノード・述部を上手く使うことで実現できるのではないでしょうか。

以下、ご参考;
クローラ作成に必須!XPATHの記法まとめ

投稿2021/01/28 02:33

_whitecat_22

総合スコア1305

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

shin_0123

2021/01/28 06:58

コメントありがとうございました。 実はHTMLをよく見ると商品別にliタグで囲まれている事に気付き この範囲を切り出したWebElementを作って、 そこから商品名や価格を抜きす事で、やりたいことは解決できました。 とは言えXpathも勉強しておきます。
_whitecat_22

2021/01/28 07:04

それは良かったです。^^ 要素の取得にはたくさんの方法がありますので、覚えて損はありません。 少しでもお役に立てたならば嬉しく思います。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.36%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問