統計Rの関数が実行されない

前提・実現したいこと

強化学習で、下記の初心者向けの課題に取り組んでいます。

『選択肢A(報酬が70%の確率で得られる), B(報酬が30%の確率で得られる)のうちから行動を選択する、Q学習モデルの仮想実験を、1セット200試行として、1000セット行い、1セットあたりで、報酬が70%の確率で得られるAを選んだ試行の割合を算出しなさい。』
*片平健太郎著行動データの計算論モデリング:強化学習モデルを例として問題2.2

上記の課題において、α, βの値を変更することで、Aを選択する割合がどのように変化するかを確認したいのですが、関数の実行ができていません。
R初心者で、関数の定義、引数、返り値、呼び出しの部分が、曖昧なので、物凄く単純な問題だと思います。
どうしたら、calc_optimrate関数を実行できるようになるでしょうか？

発生している問題・エラーメッセージ

エラーは発生しません。ただ、関数が実行されません。

該当のソースコード

R
1# 関数calc_optimrateの定義
2# 最適な選択肢を選択した割合を返す関数
3# 引数
4# T: 試行数、pr: それぞれの選択肢の報酬確率、alpha: 学習率、beta: 逆温度
5
6calc_optimrate <- function(T, pr, alpha, beta) {
7  
8  # 最適な選択肢を必ず1番目の選択肢にする
9  if (pr[1] <= pr[2]) {
10    stop(paste("1番目の報酬確率を2番目より大きくしてください。"))
11  }
12  
13  # Q値の初期化(選択肢の数 x T)
14  Q <- matrix(numeric(2*T), nrow=2, ncol=T)
15  
16  c <- numeric(T) # 各試行での選択（1=A, 2=B）
17  r <- numeric(T) # 各試行での報酬
18  pA <- numeric(T) # Aの選択確率
19  
20  for (t in 1:T) {
21    
22    # ソフトマックスで選択肢Aの選択確率を決定する
23    pA[t] <- 1/(1+exp(-beta*(Q[1,t]-Q[2,t])))
24    
25    if (runif(1,0,1) < pA[t]) {
26      # Aを選択
27      c[t] <- 1
28      r[t] <- as.numeric(runif(1,0,1) < pr[1])
29    } else {
30      # Bを選択
31      c[t] <- 2
32      r[t] <- as.numeric(runif(1,0,1) < pr[2])
33    }
34    
35    # 行動価値の更新
36    if (t < T) {
37      
38      Q[c[t],t+1] <- Q[c[t],t] + alpha * (r[t] - Q[c[t],t] ) 
39      
40      # 選択肢していない行動の価値はそのままの値を次の時刻に引き継ぐ。
41      # 3-c でc=1 なら2, c=2 なら1, というように
42      # 逆側の選択肢のインデックスが求まる。
43      Q[3-c[t],t+1] <- Q[3-c[t],t]
44    }
45  }
46  
47  return(list(optimrate=mean(c==1),
48              pr=pr,
49              alpha=alpha,
50              beta=beta))
51}
52
53# 試行数
54T <- 200
55
56alpha <- 0.3     # 学習率
57beta <- 2.0      # 逆温度
58
59# それぞれの選択肢の報酬確率
60pr <- c(0.7,0.3)
61
62ret <- calc_optimrate(T, pr, alpha, beta)

試したこと

関数の定義、引数、返り値、呼び出しの部分が、曖昧です。
物凄く単純な問題だと思います。

行動規範の内容に同意します

回答1件

ベストアンサー

こんな結果が表示されましたが。

> ret <- calc_optimrate(T, pr, alpha, beta)
> ret

$optimrate
[1] 0.69

$pr
[1] 0.7 0.3

$alpha
[1] 0.3

$beta
[1] 2

>

投稿2021/05/16 09:12

technocore

総合スコア7355

YYJP

2021/05/16 09:37

実行できてたんですね。本当に助かりました、ありがとうございました！

行動規範の内容に同意します

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう！

統計Rの関数が実行されない

前提・実現したいこと

発生している問題・エラーメッセージ

該当のソースコード

試したこと

関連した質問