前提・実現したいこと
時間帯別のメールの開封率についてデータ分析しています。
開封率 = 開封数 / 受信数
としています。
発生している問題
この受信数が、開封数に比べて非常に大きいため、
比率を出すとおかしなことになっています。
このように、受信数が多い時間帯ほど、開封数も多いのですが、
これを受信数と開封率のグラフにすると、
受信数が多い時間帯ほど、開封率が低いということになってしまいます。
試したこと
受信数と開封数をmin-maxスケーリングしたあと、開封率を出してみましたが、0で徐算することになる時間帯があり、うまくいきません。
このような場合、数学的あるいは統計学的にただしいスケーリングの方法などはあるのでしょうか?