質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
HTML5

HTML5 (Hyper Text Markup Language、バージョン 5)は、マークアップ言語であるHTMLの第5版です。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

2回答

388閲覧

python サイト上で要素の中に特定のタグがない場合は空のリストを返し、ある場合は選択されているテキストを返す

hilowkey

総合スコア29

HTML5

HTML5 (Hyper Text Markup Language、バージョン 5)は、マークアップ言語であるHTMLの第5版です。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2022/01/25 01:09

開いてくださりありがとうございます。
以下のHTMLの場合

HTML

1<table> 2 <tbody id="orderitemlist"> 3 <tr> 4 <td>A</td> 5 <td>B</td> 6 <td>C</td> 7 <td> 8 <select> 9 <option value="1"></option> 10 <option value="2" selected="selected"></option> 11 <option value="3"></option> 12 </select> 13 </td> 14 <td>D</td> 15 <td>E</td> 16 </tr> 17 </tbody> 18
<td>というタグが合計で6個あり、そのうちの一つに<select>があり、今は「2」が選ばれている状態なのですが、<td>の数だけ空のリストを返し、もしその中に<select>があれば選択されているテキストをリストに返すという場合どの様にすればよろしいでしょうか?

BeautifulSoupを使用してみようと思いましたがコードが思いつかず、

python

1import select 2selecteds4= [ ] 3goodses = 取得した特定要素の数 4 5 try: 6 dropdown4 = browser.finds_element_by_css_selector('td select') 7 select4 = Select(dropdown4) 8 selected4 = select4.first_selected_option.text 9except: 10 selected4 = ' ' 11 12selecteds4.append(selected4) 13n = 1 14while True: 15 if n != len(goodses): 16 selecteds4.append('-') 17 n +=1 18 else: 19 break

このようにしてみましたが、空のリストが他のリストと噛み合う様に返せず

[' -', '- ', '-', '2', '-', '-']と返したいが

[' 2', '- ', '-', '-', '-', '-']になってしまっています。

どうかご教授のほどよろしくお願い致します。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

自己解決

解決しませんでしたがひとまず解決済みとさせて頂きます。

投稿2022/01/28 00:52

hilowkey

総合スコア29

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

HTML テキストは test.html ファイルに入っているとして、以下は BeautifulSoup を使う場合です。

python

1from bs4 import BeautifulSoup 2 3with open('test.html') as f: 4 soup = BeautifulSoup(f.read(), 'html.parser') 5 6lst = [] 7for i in soup.select('tbody#orderitemlist > tr > td'): 8 s = i.select_one('select > option[selected="selected"]') 9 lst.append(s.get('value') if s else '-') 10 11print(lst) 12 13# 14['-', '-', '-', '2', '-', '-']

投稿2022/01/25 03:47

melian

総合スコア19749

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

hilowkey

2022/01/25 04:16

知識が足りず重ねて質問申し訳ありません。 test.htmlなどのファイルには落とし込まず 現在サイトから直接HTMLを調べながらプログラムしているのですが、こちらのコードだと一度test.htmlとしてファイル化させた方がいいということでしょうか?
melian

2022/01/25 04:25

その場合は requests パッケージを使ってみてはどうでしょうか。一例として、以下の様にします。 import requests r = requests.get('http://...') soup = BeautifulSoup(r.content, 'html.parser')
hilowkey

2022/01/25 11:38

requestsパッケージを使用したところ、こちらがWordpressのサイトでログインが必要な為なのか url = browser.current_urlとした上で session.get(url)、requests.get(url) としても最初のログインが画面のところからsoup内でのurlが移動してくれずうまくいきませんでした。。
melian

2022/01/25 11:46

ログイン処理が必要なのですね。そうなりますと Selenium でしょうか。
hilowkey

2022/01/25 16:18

ログインが必要な場合soupだとできないことを知りませんでした。 申し訳ございません。 もう少しこのまま質問状態にさせて頂こうかと思いますm(_ _)m
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問