現在、あるサイトにスクレイピングして
値を取得し、データベースに保存し、管理するプログラムを
pythonで作成しています。
しかし、情報が記載されている、表の部分が情報量によって変化するため
xpathで指定していた場合、ズレてしまい、データベースで用意している
カラムと関係性もズレてしまいます。
なので、対策として指定のtable内のhtmlコードを取得し、
別に解析をしようと考えていますが、
調べたところ指定のtable内のhtmlコードを取得するような方法を
自力では、見つけられませんでした。
一般的なページのhtmlを丸ごと取得する方法だと
他の部分でスクレイピングで要素指定して、値を取得しており、
二度手間となるので、それは避けたいです。
一応現時点で、
欲しい情報があるxpathとして以下のように指定しております。
//*[@id="detail"]/div[1]/table[4]/tbody
ご存じの方、いらっしゃいましたら
ご教授よろしくお願いいたします。
あなたの回答
tips
プレビュー