【python】Excelで空白の行がエラーになってしまう

Question

### 前提
excelで人事評価一覧表をpythonを使って作成しています。
既存の従業員一覧表ファイル（excel）に社員番号、社員名、従業員区分などが記載されており、従業員区分が「社員」のものだけを抽出し、新規作成した人事評価一覧表に「社員」で該当した者の社員名と社員番号を転記する作業を行っています。

従業員一覧表の範囲はmax_row関数を使って最大行数を取得しているのですが、表は232行までしかないにも関わらず、max_row=235と出てしまいます。
今回、セルに社員と書かれているかどうかで分岐をしているのでmax_rowの値が違うとしても影響はないと考えていたのですが、233行目から” if df_shain.iloc[i,4] == '社員':”の箇所で下記のようなエラーが出てしまいます。（エラー文では228行目となっていますが、ヘッダーがあるため実際は233行目に該当します。）
実際のExcelをお見せできないため、非常に分かりづらく申し訳ありませんが、233行目からはただ空白のセルが続いているだけです。
表の途中にも従業員区分が空白の箇所はあるのですが、そこでエラーを吐くことがないため原因が分かりません。

憶測でご回答いただくことになってしまうかと思いますが、どのような要因で下記のエラーが出てしまうことがあるのかご教示お願い致します。

### 発生している問題・エラーメッセージ

```
index 228 is out of bounds for axis 0 with size 228
  File "C:\Users\ko\Documents\python\jinjitest	est.py", line 34, in <module>
    if df_shain.iloc[i,4] == '社員':
       ~~~~~~~~~~~~~^^^^^
IndexError: index 228 is out of bounds for axis 0 with size 228
```

### 該当のソースコード

```python
import pandas as pd
import openpyxl
import glob
import warnings
import os

warnings.filterwarnings('ignore')

#人事評価一覧の作成
df_new = pd.DataFrame()
df_new.to_excel('新方式一覧表_test.xlsx', index=False)
wb_new = openpyxl.load_workbook('新方式一覧表_test.xlsx',data_only=True)
ws_new = wb_new.active

#従業員一覧表の読み込み
shain_path =glob.glob( './data/list/*.xlsx')
for shain in shain_path:
    wb_shain = openpyxl.load_workbook(shain, data_only=True)
    ws_shain = wb_shain.active
df_shain = pd.read_excel(shain,header=3)
#表の最大範囲を指定
max_r = range(ws_shain.max_row-5)
max_c = range(ws_shain.max_column)

#社員を抽出
i=0
x=2
for i in max_r:
    data = {}
    if df_shain.iloc[i,4] == '社員':
        #社員名抽出
        menb = str(df_shain.iloc[i,1])
        #社員番号抽出
        code = df_shain.iloc[i,0]
        
        #人事評価一覧表に転記
        ws_new.cell(row=x,column=2).value = menb
        ws_new.cell(row=x,column=1).value = code
        ws_new.cell(row=x,column=3).value = '社員'
        x = x + 1

wb_new.save('新方式一覧表_test.xlsx')
```

### 試したこと
エラー文で検索してみたり、Excelのテーブル範囲を再設定などしてみましたが、解決しませんでした。
また、表を別シートにコピペし、同じコードで実行したところ、max_rowは正常な値になったのですが、233行目は同じくエラーになってしまいます。
テーブルの外側はエラーになってしまうような仕様なのかと考えていますが、かなり不便です。

Accepted Answer

根本的な解決策ではありませんが、問題になっているDataFrameは使わなくてもいいのではないこと思います。

シートをDataFrameに読み込んで使っていますが、
> ws_new.cell(row=x,column=2).value = menb
> ws_new.cell(row=x,column=1).value = code
> ws_new.cell(row=x,column=3).value = '社員'
> 上記のコードやmax_rowを使うためにopenpyxlを、カラムを作成するためにDataFrameを用いている

抜粋すると以下のように、DataFrameのデータはセルの値の参照のみで使っています。
```python
df_shain = pd.read_excel(shain,header=3)

if df_shain.iloc[i,4] == '社員':

menb = str(df_shain.iloc[i,1])

ws_new.cell(row=x,column=2).value = menb
```

セルの参照だけであれば、openpyxl でできるので、それで充分だと思います。
抜粋ですが、以下のようしてみてはいかがでしょうか。
ただし、「row=i + 5」のところとか、columnの値などは調整が必要かもしれません。
```python
# 不要
# df_shain = pd.read_excel(shain,header=3)

#社員を抽出
x=2
for i in max_r:
    data = {}
    if ws_shain.cell(row=i + 5, column=4).value == '社員':
    #if df_shain.iloc[i,4] == '社員':
        #社員名抽出
        menb = str(ws_shain.cell(row=i + 5, column=1)).value
        #menb = str(df_shain.iloc[i,1])
        #社員番号抽出
        code = ws_shain.cell(row=i + 5, column=0).value
        #code = df_shain.iloc[i,0]
        
        #人事評価一覧表に転記
        ws_new.cell(row=x,column=2).value = menb
        ws_new.cell(row=x,column=1).value = code
        ws_new.cell(row=x,column=3).value = '社員'
        x = x + 1

wb_new.save('新方式一覧表_test.xlsx')
```

Answer

データフレームを使わないようにしました。
```Python3
import pandas as pd
import openpyxl
import glob
import warnings
import os

warnings.filterwarnings('ignore')

#人事評価一覧の作成
df_new = pd.DataFrame()
df_new.to_excel('新方式一覧表_test.xlsx', index=False)
wb_new = openpyxl.load_workbook('新方式一覧表_test.xlsx',data_only=True)
ws_new = wb_new.active

#従業員一覧表の読み込み
shain_path =glob.glob( './data/list/*.xlsx')
for shain in shain_path:
    wb_shain = openpyxl.load_workbook(shain, data_only=True)
    ws_shain = wb_shain.active

x=2
for wrow in range(5,ws_shain.max_row+1):
    if ws_shain.cell(wrow,5).value == '社員':
        #人事評価一覧表に転記
        #社員名
        ws_new.cell(row=x,column=2).value = ws_shain.cell(wrow,2).value
        #社員番号
        ws_new.cell(row=x,column=1).value = ws_shain.cell(wrow,1).value
        ws_new.cell(row=x,column=3).value = '社員'
        x = x + 1

wb_new.save('新方式一覧表_test.xlsx')

```

前提

発生している問題・エラーメッセージ

該当のソースコード

試したこと

関連した質問