スクレイピングを行いたいのですが、うまくできないので困っています。
xpathの使い方が分かる方ご教授いただけませんでしょうか。
以下のようなhtmlなんですが、「タイトルA」のテーブルのtdの情報が欲しいです。
ですが、現状では、全てのテーブルのtdがとれてしまいます。
html
1 2<body> 3 <div class="aaa"> 4 <div class="bbb"> 5 <div class="ccc"> 6 <h2 class="ddd"> 7 <span>タイトルA</span> 8 </h2> 9 </div> 10 </div> 11 <div class="tbl"> 12 <table class="def-tbl"> 13 <tbody> 14 <tr> 15 <th>あああああああ</th> 16 <td>いいいいいいい</td> 17 </tr> 18 <tr> 19 <th>うううううううう</th> 20 <td>おおおおおおおお</td> 21 </tr> 22 <tr> 23 <th>カカカカカカかか</th> 24 <td>ききキキキキ聴き</td> 25 </tr> 26 </tbody> 27 </table> 28 </div> 29 <div class="bbb"> 30 <div class="ccc"> 31 <h2 class="ddd"> 32 <span>タイトルB</span> 33 </h2> 34 </div> 35 </div> 36 <div class="tbl"> 37 <table class="def-tbl"> 38 <tbody> 39 <tr> 40 <th>あああああああ</th> 41 <td>いいいいいいい</td> 42 </tr> 43 <tr> 44 <th>うううううううう</th> 45 <td>おおおおおおおお</td> 46 </tr> 47 <tr> 48 <th>カカカカカカかか</th> 49 <td>ききキキキキ聴き</td> 50 </tr> 51 </tbody> 52 </table> 53 </div> 54 </div>
現状のコードは以下となります。
ruby
1 table_data = table_page.search('//table[@class="def-tbl"][1]//td')
例えばですが、以下のコードから、それに関連するテーブルをとって来ることなどはできたりするのでしょうか。。
ruby
1//span[contains(text(), 'タイトル')]
お分かりの方がいらっしゃればよろしくお願いします!
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2020/04/06 03:13