Machine Learning — Probability & Statisticsが詳しいです。
確率の表現
P(A)
とあった場合、
Pが確率 Probability を算出するための関数、Aが起きる現象を示します。例えば、P(宝くじ当たり)
であれば宝くじを引いたときにくじが当たりである確率を求める関数になります。
(参考)
似た例では、P(A|B)
とあった場合、
Pが確率 Probability を算出するための関数、Aが前提条件、Bがある前提条件における確率を求めたい特定の現象になります。例えば、P(COVID-19陽性者|重症化)
であれば、COVID-19陽性者の重要化率を求める関数になります。
質問への回答
入力画像をxとするときに、画像xの確率をp(x)として、尤度p(x)を最大化させるようにパラメータを学習しますが、入力画像の確率p(x)は何を意味しているのでしょうか?
確率p(x): xというカテゴリの画像が、xというカテゴリに分類される確率pを表します。
入力画像の確率とは、たとえば犬の画像が10回に1回の確率で来るとしたら、
p(x=犬) = 0.1
となり、それを最大化することでなぜ学習となるのでしょうか?
p(犬) = 0.1であれば、犬の画像を処理た時に、10%しか犬だと判定しません。
p(犬) = 0.9であれば、犬の画像を処理た時に、90%は犬だと判定します。
p(x)を最大化するということは、正しく判別するための基準を学ばせるということになります。
これは、元データが以下のように9割が猫、1割が犬のデータであっても、同じです。
猫猫猫猫猫猫猫猫猫犬
p(犬) = 0.9であれば、元のデータセットにおける犬画像の比率が何であれ、犬の画像を処理したら9割は犬だと言い張る判別装置、という意味です。