前提・実現したいこと
統計学についての質問です。
私は現在、気象と感染症の因果関係に関する研究をしています。
(感染症は、インフルエンザとコロナウイルスです)
しかし私は建築学部で統計学に関する知見が、専門的にはありません。
私が考えている、自分の研究における統計分析は、
1, 「気象データ」を説明変数, 「感染者数データ」を目的変数として、単回帰分析を行う。
2, インフルエンザ共に全体的に相関係数, 決定係数を見て、単回帰分析では分析の精度があまいと判断した。
3, そこで多項式線型回帰を用いて、過剰フィッティングが起こらない二次曲線か三次曲線を用いて、相関係数と決定係数を全体的に見て分析結果を考察する。
と言う流れで統計分析を考えています。
分析はPythonで行います。
私が知りたいのは、
・どこか考え方の間違いはないか?
・相関係数や決定係数だけでは検討項目が少ないかどうか?
・多項式線型回帰の使い方やこの分析モデルに対する考え方に間違いがないか?
などを教えていただきたいです。