複数の画像データの標準化

Question

### 前提
ある論文の再現をしようとしていますが、画像の標準化のところで苦戦しています。
使用言語はpythonです。
目標としては以下の図のような標準化をしたいと考えています。
（a）が元画像、（b）が標準化後です。
![イメージ説明](https://ddjkaamml8q8x.cloudfront.net/questions/2022-10-12/c4bb507f-1751-4b6a-83f1-166a712bff80.png)

論文中のデータセットは以下のようになっています。
一つのインデックスには画像のサイズである60×160の計9600次元が特徴量として入力されています。
画像は2880枚あり各画像がインデックスを担っています。
応答値は画像と関係ないので省きます。
![イメージ説明](https://ddjkaamml8q8x.cloudfront.net/questions/2022-10-12/d9b37e6b-7f4d-4863-a6b8-6a4c58d5c1f9.png)

標準化は以下の画像に示した式に従い行っているそうです。
なお、iは番号（画像の番号）、jは列番号（特徴量の番号）を示しており、μは平均、σは標準偏差を示しているそうです。
![イメージ説明](https://ddjkaamml8q8x.cloudfront.net/questions/2022-10-12/d69c8332-f480-43aa-bbfb-72ff188e47fd.png)

### 実現したいこと

前提で提示したような標準化画像が得たい。
現在は前段階として画像枚数を5枚のデータセットで実現しようとしている。
ライブラリーインポート後に画像の読み込み、サイズの変更などをしている。
![イメージ説明](https://ddjkaamml8q8x.cloudfront.net/questions/2022-10-12/5f3e57d2-2f07-423b-94f0-e6a544ead06e.png)

その後データセットを作成した。![イメージ説明](https://ddjkaamml8q8x.cloudfront.net/questions/2022-10-12/3a81c8f3-9729-4680-9b75-14cd0056fe6d.png)

データセット作成後に各値を変数に代入した。
![イメージ説明](https://ddjkaamml8q8x.cloudfront.net/questions/2022-10-12/d5b46fc9-a5c3-4a6f-b2b4-55f3a5d38798.png)

代入後にいよいよ標準化したらエラーが出てきた。
標準化のコードは以下のとおりである。
![イメージ説明](https://ddjkaamml8q8x.cloudfront.net/questions/2022-10-12/eda1e67a-ad63-40e8-b067-05c0ea12b12b.png)

### 発生している問題・エラーメッセージ

```
SettingWithCopyWarning: 
A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_copy[index_count][colum_count]=(df[index_count][colum_count]-df_mean[colum_count])/df_std[colum_count]
---------------------------------------------------------------------------
ValueError                                Traceback (most recent call last)
File ~\anaconda3\lib\site-packages\pandas\core\indexes\range.py:385, in RangeIndex.get_loc(self, key, method, tolerance)
    384 try:
--> 385     return self._range.index(new_key)
    386 except ValueError as err:

ValueError: 5 is not in range

The above exception was the direct cause of the following exception:

KeyError                                  Traceback (most recent call last)
Input In [17], in <cell line: 1>()
      1 for colum_count in range(colum_counts):
      2     for index_count in range(index_counts):
----> 3         df_copy[index_count][colum_count]=(df[index_count][colum_count]-df_mean[colum_count])/df_std[colum_count]

File ~\anaconda3\lib\site-packages\pandas\core\series.py:958, in Series.__getitem__(self, key)
    955     return self._values[key]
    957 elif key_is_scalar:
--> 958     return self._get_value(key)
    960 if is_hashable(key):
    961     # Otherwise index.get_value will raise InvalidIndexError
    962     try:
    963         # For labels that don't resolve as scalars like tuples and frozensets

File ~\anaconda3\lib\site-packages\pandas\core\series.py:1069, in Series._get_value(self, label, takeable)
   1066     return self._values[label]
   1068 # Similar to Index.get_value, but we do not fall back to positional
-> 1069 loc = self.index.get_loc(label)
   1070 return self.index._get_values_for_loc(self, loc, label)

File ~\anaconda3\lib\site-packages\pandas\core\indexes\range.py:387, in RangeIndex.get_loc(self, key, method, tolerance)
    385         return self._range.index(new_key)
    386     except ValueError as err:
--> 387         raise KeyError(key) from err
    388 self._check_indexing_error(key)
    389 raise KeyError(key)

KeyError: 5
```

### 該当のソースコード

```ここに言語名を入力
for colum_count in range(colum_counts):
    for index_count in range(index_counts):
        df_copy[index_count][colum_count]=(df[index_count][colum_count]-df_mean[colum_count])/df_std[colum_count]
```

### 試したこと

どこから間違っているのかもわかりません。
そもそも論文では60×160というサイズ表記で9600次元のところもRGBのデータがないのがよくわかっていません。
わかることがあれば些細なことでも教えていただけると助かります。

### 補足情報（FW/ツールのバージョンなど）

ここにより詳細な情報を記載してください。

Answer

1.エラーの解決方法
df[i][j]ではiが列、jが行に対応してしまいます。
行と列が入れ替わってしまうので、エラーメッセージで「6行目はありませんよ」と出てしまっています。

解決方法は、df.iat[i,j]を使うことです。こちらはiが行、jが列に対応します[（iatの使い方の参考リンク）](https://note.nkmk.me/python-pandas-at-iat-loc-iloc/)。
df_copy[index_count][colum_count]のところで、df_copy.iat[index_count,colum_count]のように使います。
df[index_count][colum_count]も同様に、df.iat[index_count,colum_count]と書き換えてください。

2.コード中のバグが起きそうな箇所
df_copy=df
とするのは危険です。
df_copyを変更したときにオリジナルのdfも変更されてしまうので、バグの原因になります[（参考リンク）](https://www.learning-nao.com/?p=2384)。
df_copy = df.copy()
とするのが良いです。

3.RGBチャンネルの扱い
RGBチャンネルを足し合わせて1つにまとめるには、np.sum()が使えます。
flattenする前のarrayに対して、np.sum(array, axis=2)として使います。
平均ではなく合計のsumにした理由は、小数点型にしないためです。
また、後に標準化するので、結果は変わらないはずです。
ただし、本当にsumが適切かどうかは、元論文の手法の部分をよく確認してみてください。

Answer

```python
import pandas as pd
df = pd.DataFrame([[0, 1, 2, 3, 4], [5, 6, 7, 8, 9], [10, 11, 12, 13, 14]])
print(df.values)
'''
[[ 0  1  2  3  4]
 [ 5  6  7  8  9]
 [10 11 12 13 14]]
'''

# 母標準偏差
df_copy0 = (df - df.mean()) / df.std(ddof=0)
print(df_copy0.values)
'''
[[-1.22474487 -1.22474487 -1.22474487 -1.22474487 -1.22474487]
 [ 0.          0.          0.          0.          0.        ]
 [ 1.22474487  1.22474487  1.22474487  1.22474487  1.22474487]]
'''

# 標本標準偏差
df_copy1 = (df - df.mean()) / df.std(ddof=1)
print(df_copy1.values)
'''
[[-1. -1. -1. -1. -1.]
 [ 0.  0.  0.  0.  0.]
 [ 1.  1.  1.  1.  1.]]
'''
```

参考
[Pythonで正規化・標準化（リスト、NumPy配列、pandas.DataFrame）](https://note.nkmk.me/python-list-ndarray-dataframe-normalize-standardize/)

Answer

一般化すると確かにそのような数式になりますが，Numpyには便利なブロードキャスト機能があるので活用しましょう．次のように書くと標準化できます．

```Python
data = list()
for file in im_file_list:
    img = np.array(Image.open(file)).flatten()
    data.append(img)
data = np.array(data)
data = (data - data.mean(axis = 0)) / data.std(axis = 0)         # feature-wise normalization
# data = ((data.T - data.mean(axis = 1)) / data.std(axis = 1)).T #  sample-wise normalization
# data = (data - data.mean()) / data.std()                       # dataset-wise normalization
```
画像処理におけるfeature-wise normalizationはあまり見かけないので，精度の向上が見込めなかったら他のものも試してみると良いでしょう．
> そもそも論文では60×160というサイズ表記で9600次元のところもRGBのデータがないのがよくわかっていません
もしかしたら論文では，RGB画像をグレースケール画像にしてから，上述の処理をしているのかもしれませんね．元画像も彩度が低く，白黒画像にしても問題ないような画像なので，そういった画像データに対してグレースケール変換はよく取られる手法の1つではあります．グレースケールで開く場合は，`Image.open(file).convert('L')`としましょう．

前提

実現したいこと

発生している問題・エラーメッセージ

該当のソースコード

試したこと

補足情報（FW/ツールのバージョンなど）

関連した質問