質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
RStudio

RStudioは、Rのプログラミングを効率化する統合開発環境です。統計計算とグラフィックスができるプログラミング言語であるRのIDEでOSSで公開されています。ソースコードやコンソールなどが一つの画面に見やすく配置されている点が特徴。コマンド名以外に、関数名やパッケージ名も補完できます。

R

R言語は、「S言語」をオープンソースとして実装なおした、統計解析向けのプログラミング言語です。 計算がとても速くグラフィックも充実しているため、数値計算に向いています。 文法的には、統計解析部分はS言語を参考にしており、データ処理部分はSchemeの影響を受けています。 世界中の専門家が開発に関わり、日々新しい手法やアルゴリズムが追加されています。

Model

MVCモデルの一部であるModelはアプリケーションで扱うデータとその動作を管理するために扱います。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

自然言語処理

自然言語処理は、日常的に使用される自然言語をコンピューターに処理させる技術やソフトウェアの総称です。

Q&A

0回答

1260閲覧

Structural Topic Model(STM) 最適なトピック数の決め方

27018595

総合スコア0

RStudio

RStudioは、Rのプログラミングを効率化する統合開発環境です。統計計算とグラフィックスができるプログラミング言語であるRのIDEでOSSで公開されています。ソースコードやコンソールなどが一つの画面に見やすく配置されている点が特徴。コマンド名以外に、関数名やパッケージ名も補完できます。

R

R言語は、「S言語」をオープンソースとして実装なおした、統計解析向けのプログラミング言語です。 計算がとても速くグラフィックも充実しているため、数値計算に向いています。 文法的には、統計解析部分はS言語を参考にしており、データ処理部分はSchemeの影響を受けています。 世界中の専門家が開発に関わり、日々新しい手法やアルゴリズムが追加されています。

Model

MVCモデルの一部であるModelはアプリケーションで扱うデータとその動作を管理するために扱います。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

自然言語処理

自然言語処理は、日常的に使用される自然言語をコンピューターに処理させる技術やソフトウェアの総称です。

0グッド

0クリップ

投稿2021/09/08 10:47

前提・実現したいこと

Structural Topic Model(STM)でトピック抽出を行っています. (R言語で実装)
最適なトピック数を決める方法で質問があります.

searchK関数の出力結果で数値とグラフが出力されるのですが
この結果からどのように最適なトピック数を判断したら良いか分かりません.
どのようにトピック数を決定したらよいか教えていただきたいです.

該当のソースコード

R

1kResult <- searchK(out$documents, out$vocab, K=c(7,8,9,10), prevalence=~rating+s(day), data=meta) 2kResult$results 3plot(kResult)

出力結果

R

1> kResult$results 2 K exclus semcoh heldout residual bound lbound em.its 31 7 8.937433 -52.95924 -7.80857 9.328384 -23391733 -23391725 17 42 8 9.090138 -58.20191 -7.793394 8.950438 -23337625 -23337614 20 53 9 9.168978 -61.09091 -7.781923 8.710382 -23296459 -23296447 25 64 10 9.256421 -61.51863 -7.764806 8.504863 -23247891 -23247876 55

kResultのプロット結果

疑問点

論文を読みましたが,以下の値が何を表しているのか理解できませんでした。

exclus:Exclusivity of each model.
semcoh:Semantic coherence of each model.
heldout:Heldout likelihood for each model.
residual:Residual for each model.
bound:Bound for each model.
lbound:lbound for each model.
em.its:Total number of EM iterations used in fiting the model.

また, 以下のグラフがそれぞれ何を表しているのか分かりません。
kResultのプロット結果

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだ回答がついていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問