GANを用いてテーブルデータの水増し

Question

### GANを用いてテーブルデータの水増し

GANを用いてデータセットの水増しを行おうと考えています．
Pythonのライブラリの[CTGAN](https://qiita.com/jovyan/items/c41ab61a6b04e9a6e4df)を用いてデータの生成自体は上手くいっていますが，分類精度の向上には大きく変化がありません．
精度向上のために，以下のことを試しましたが上手くいっていないので，精度向上のために何かアドバイスがあれば幸いです．
予測のタスクとしては２値分類で，モデルはランダムフォレストを採用しています．
（GAN自体，データセットがある程度必要になると思うので，少量のデータセットの水増しを行うこと自体矛盾している気もしています．．）
### 分類問題の内容と現状
予測のタスクとしては２値分類で，モデルはランダムフォレストを採用しています．
データセットは約1500あり，評価手法としては１０分割交差検証を採用しています．
予測精度は７３％程度で７７％ぐらいまで精度があげれないかなと．．

### 試したこと

0. アンサンブル（スタッキング）
0. Optunaを用いたチューニング
0. 遺伝的アルゴリズムを用いた特徴量選択
0. Epoch数の増加（１０万回程度）

### 補足情報（FW/ツールのバージョンなど）

Python3.7， CTGANを現状使用しています．

Accepted Answer

> （GAN自体，データセットがある程度必要になると思うので，少量のデータセットの水増しを行うこと自体矛盾している気もしています．．）

ご自身で回答なさっていることがすべてかなと思います。

データを見てみないと正確なことは言えないのが大前提ですが、

CTGANそして1-4までなさっているのであれば（もしやり方に間違えがなければ）
そもそもそういうデータなのでは。
データ加工とかまだ余地があるかもしれませんが、データを見ないと何とも言えず。

強いて挙げるのであれば
・ランダムフォレストよりもBoosting系（xgBoost、lightGBM、CatBoost）を試す
・3はやめて学習モデルに任せてみる
ことくらいでしょうか、、、

GANを用いてテーブルデータの水増し

分類問題の内容と現状

試したこと

補足情報（FW/ツールのバージョンなど）

関連した質問