pythonでのseleniumとBeautifulSoupのselect()を使用したループ時のIndexErrorについて

Question

### 前提

PythonのseleniumとBeautifulSoupを使ってWebサイトを操作するプログラムを作っています。

HTMLテーブルのtr要素を`soup.find_all("tr")`でリスト化し、`while i <= len(array) - 1`で繰り返し処理しています。

繰り返し処理内の最後で使用した配列の要素を`del array[i]`削除して、配列の要素がなくなるまで繰り返すという形です。

tr要素内には数字を含むIDセレクタが割り当てられており、変数`i`と同じ数字を持っています。

ループの1回目はうまく機能するのですが、2回目になると`soup.select()`の部分で`IndexError:list index out of range`が発生してしまいます。

### 発生している問題・エラーメッセージ

```python
Traceback (most recent call last):
  File "C:\Users\Administrator\osbot	est_os-bot_2.1.py", line 99, in <module>
    os_td_id = str(os_td_id_pre[0].contents).lstrip("['").rstrip("']")
IndexError: list index out of range
```

### 該当のソースコード

```python
# 前略
# 2.1.1 HTMLをBeautifulSoupで解析
driver.get('https://example.com')
os_html = driver.page_source.encode('utf-8')
os_soup = BeautifulSoup(os_html, 'lxml')

# サイト内メインテーブル
os_table = os_soup.find('table', id="table1")
os_tr_array = os_table.tbody.find_all('tr', recursive=False)

# tr要素で不要な最初の要素を削除
del os_tr_array[0]

# ループ前に変数初期化
i = 0

# ループ用の値をセット
os_tr_array_len = len(os_tr_array) - 1

# メインループ（while版）
# テーブルのtr要素が存在する場合にループ
while i <= os_tr_array_len:
    # 配列から処理する行を指定
    os_tr = os_tr_array[i]
    # ウインドウを所定の位置へ
    driver.switch_to.window(driver.window_handles[0])
    # ソースコードを取得してパーサー処理
    os_tr_html = os_tr.encode('utf-8')
    os_tr_soup = BeautifulSoup(os_tr_html, 'lxml')

# メモ欄を取得して変数に格納
    os_td_memo_css = 'memo' + str(i) + 'txtmemo_' + str(i) + '_I' 
    os_td_memo_box = driver.find_element(By.ID, os_td_memo_css)

# 例外処理：メモ欄に何か入力されている場合はスキップする
    os_td_memo_box_val = os_td_memo_box.get_attribute('value')
    if os_td_memo_box_val:
        i += 1
        continue

# 注文Noを取得
    os_td_id_css = '#no + str(i) + 'id_' + str(i)
    os_td_id_pre = os_tr_soup.select(os_td_id_css)
    print(os_td_id_pre)
    os_td_id = str(os_td_id_pre[0].contents).lstrip("['").rstrip("']")
    print("商品の情報を入手します...")
    print(os_td_id)

driver.refresh()

# 次のループ前処理
    del os_tr_array[i]
    os_tr_array_len = len(os_tr_array) - 1
```

### 試したこと

2回目のループでも`print(os_tr)`で値が取得されているかを確認しました。
→そこは正常に取得されていました

独学なのでコードも見づらいかと思いますが、ご教授いただければ幸いです。
よろしくお願いいたします。

Accepted Answer

`while i <= os_tr_array_len:`で、`i`を確認した上で、`i += 1`していますが、
元の`i`が`os_tr_array_len`と等しい場合、`+1`すると`os_tr_array_len+1`となって、
添え字範囲を超えますので、`del os_tr_array[i]`がエラーになります。

削除する方法でもちゃんと考えれば出来ると思いますが、
「残したい物だけ残し、そうで無い物は削除する」より「もとのリストはそのままにして、残したい物だけからなる新しいリストを作る」方がわかりやすいです。

どうしても削除する場合は、後ろから順に処理してよければ、後ろから処理するとロジックが簡単になります。

Answer

ご回答頂いた内容を参考にコードを修正したところ、解決しましたのでこちらにその修正箇所を記載します。

修正前

```python
    driver.refresh()

# 次のループ前処理
    del os_tr_array[i]
    os_tr_array_len = len(os_tr_array) - 1
```

修正後

```python
    driver.refresh()

# 次のループ前処理
    # 更新したページの内容で配列を再生成
    os_html = driver.page_source.encode('utf-8')
    os_soup = BeautifulSoup(os_html, 'lxml')
    os_table = os_soup.find('table', id="PageContent_ASPxSplitter1_GridView_DXMainTable")
    # 配列を更新
    os_tr_array = os_table.tbody.find_all('tr', recursive=False)
    # tr要素で不要な最初の要素を削除
    del os_tr_array[0]
    os_tr_array_len = len(os_tr_array) - 1
```

以上になります。
かなりの長時間悩んでいたので、様々な視点からのアドバイスをいただくことができ、とても参考になりました。
ありがとうございました。

Answer

配列の要素を順に処理するにあたって、そのループの中で配列の要素を削除していくのは筋が悪いと思います。

```python
while i <= os_tr_array_len:
    # 配列から処理する行を指定
    os_tr = os_tr_array[i]
    # 処理
    del os_tr_array[i]
    os_tr_array_len = len(os_tr_array) - 1
```
こうでなく、

```python
for os_tr in os_tr_array:
    # 処理
```
これで充分だと思います。 
これではだめな理由はありますか？

前提

発生している問題・エラーメッセージ

該当のソースコード

試したこと

関連した質問