###
プログラミング初心者です。
Pythonを使ってWebスクレイピングを行うプログラムを書いています。
Arcserveというアプリケーションのバージョン情報を以下のURLサイト(後述)の、
"ARCSERVE BACKUP R17.5 FOR WINDOWS DOWNLOAD INFORMATION LIST"
から取得したいです。
具体的には、"release date","Contents","file name"カラム(蛍光ペンで囲んだ列)の情報です。
開発者ツールでHTML要素見ると、上の情報は<td>タグで囲まれているため、
soup.findAll('td')と書き、全ての<td>タグを抽出しようとしました。
しかしいざプログラムを書き実行してみると、エラーメッセージではなく、[]が出るだけで、
情報が取得できません。
findAllの部分をselectにしたり、対象のタグをclassに変えてみたりと試したのですが
うまくいかず、先に進めない状態です。
今回の場合、どのようにコードを書けば、希望の情報を抽出できるでしょうか。
非常に初歩的な質問で申し訳ないのですが、お力添え頂ければ幸いです。。
ArcserveアプリケーションURL:
https://support.arcserve.com/s/article/115001198543?language=ja
開発環境
・macOS
・python3以降
・IDEは使っておらず、テキストエディタ上でコーディングしている
コード
# -*- coding: utf-8 -*- from bs4 import BeautifulSoup import requests import sys url = "https://support.arcserve.com/s/article/115001198543?language=ja" r = requests.get(url) soup = BeautifulSoup(r.text, 'html.parser') # 入れ子要素を取得する場合は、soupの後ろに".'要素タグ'."を入れる # バージョン情報を抽出 version_elem = soup.findAll('td') print(version_elem)
エラーメッセージ
$ python Arcserve.py []
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2019/12/01 14:30
2019/12/02 02:57
2019/12/02 14:30
2019/12/02 23:16
2019/12/04 12:30