wikipedia情報によりますと、LDAのハイパーパラメータのαは通常1より小さい数でηは1より遥かに小さい数となっています。(wikiの方ではηではなくβになってました)
これはなぜでしょうか。
αはトピックを生成するためのDirichlet分布のパラメータであり、ηは単語を生成するためのDirichlet分布のパラメータです。
そして、Dirichlet分布ではパラメータが小さくなると局所的な分布になります。
ここまではわかっているのですが、単語を生成するのになぜトピックを生成するより局所的出ないといけないのかがわかりません。
あなたの回答
tips
プレビュー