teratail header banner
teratail header banner
質問するログイン新規登録

質問編集履歴

1

同ドメインでトップページで試すと正常に動作、このディレクトリ配下では動作がうまくいかない。

2021/02/13 02:12

投稿

hiro_python
hiro_python

スコア4

title CHANGED
File without changes
body CHANGED
@@ -1,10 +1,8 @@
1
- Pythonにて、CSSセレクタを使いHTMLの一部の監視をして、差分チェックするプログラムを見よう見まねで作ってみました。
1
+ Pythonにて、CSSセレクタを使いHTMLの一部の監視をして、差分チェックするプログラムを見よう見まねでみました。
2
2
  いくつか動作チェックをしていると、ある特定のページで動作がうまくいかず、困っています。
3
3
 
4
- 以下ページの一番上にある日付の更新をチェックしたいのですが、Google Chromeの検証モードで
4
+ 以下ページの一番上にある日付の更新をチェックしたいのですが、
5
- コピーしたCSSセレクタでは取得データが空になり、tbodyを外した場合ではデータを取得できるが
6
5
  毎回同じデータにも関わらず更新検知(True)されてしまいます。
7
-
8
6
  どこが悪いのかわからず困っています。手助けして頂けると幸いです。
9
7
 
10
8
 
@@ -21,7 +19,7 @@
21
19
  import datetime
22
20
  import pytz
23
21
 
24
- code = '0000'
22
+ code = '6653'
25
23
  name = '正興電機製作所'
26
24
  url = 'https://www.seiko-denki.co.jp/news/'
27
25
 
@@ -35,8 +33,8 @@
35
33
 
36
34
 
37
35
  def get_website():
38
- # 更新を検知したい箇所を指定 (!!tbody外すとデータ取得できるが、今度は毎回更新検知されてしまう)
36
+ # 更新を検知したい箇所を指定
39
- elems = soup.select('#contents > table > tbody > tr:nth-child(1)') # copy -> selector
37
+ elems = soup.select('#contents > table > tr:nth-child(1)') # copy -> selector
40
38
  str_elems = str(elems) # stringに変換
41
39
  try:
42
40
  f = open(file)