回答率: 85.48%

質問するログイン新規登録

トップに関する質問 Q学習のプログラム　エラーがでてしまいます

編集履歴

質問編集履歴

3

再度変更しました。

2020/05/22 09:34

投稿

スコア0

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -26,7 +26,7 @@
-条件の設定
+#条件の設定
 S = np.array(list(range(0,820)))#状態(1+9+9^2+9^3) #0~819までの行列
@@ -34,7 +34,7 @@
 risk0 = np.array([0,3,0,1,4,1,6,0,1])#初期状態の件数
-活動効果値
+#活動効果値
 r0 = 2*np.array([1,0.5,0.25,0.5,0.5,0.25,0.25,0.25,0.25])
@@ -54,7 +54,7 @@
 r8 = 2*np.array([0.25,0.25,0.25,0.25,0.5,0.5,0.25,0.5,1])
-次期の状態(S1=s11+s12)
+#次期の状態(S1=s11+s12)
 s11 = np.array(list(range(1,820))).reshape(91,9)
@@ -64,7 +64,7 @@
-学習方法（ハイパーパラメータ)の設定
+#学習方法（ハイパーパラメータ)の設定
 alpha = 0.01#学習率
@@ -74,7 +74,7 @@
-データフレーム作成用リストの作成
+#データフレーム作成用リストの作成
 list1 = [[] for _ in range(10)]   #変数を"_"と置いた
@@ -84,13 +84,13 @@
-行動価値関数テーブルの初期化
+#行動価値関数テーブルの初期化
 Q = np.zeros(S1.shape)
-行動(活動実施メッシュ)に応じて報酬(効果値)を選択
+#行動(活動実施メッシュ)に応じて報酬(効果値)を選択
 def ziko(a):
@@ -132,7 +132,7 @@
-Q学習のメイン関数
+#Q学習のメイン関数
 def q_learning():
@@ -166,7 +166,7 @@
-    データフレーム作成用リストにデータを追加
+    #データフレーム作成用リストにデータを追加
     for j in range(9):
@@ -176,7 +176,7 @@
-次期状態S1でのQ(行動価値関数)のリスト作成
+#次期状態S1でのQ(行動価値関数)のリスト作成
 def s1max():
@@ -190,7 +190,7 @@
-メイン関数の実行
+#メイン関数の実行
 for k in range(n):
@@ -200,7 +200,7 @@
-Q値データのリストをデータフレームに変換
+#Q値データのリストをデータフレームに変換
 df = pd.DataFrame(list1[1:]).T

2

コードを書き直しました。ご指摘ありがとうございます。

2020/05/22 09:34

投稿

スコア0

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -14,6 +14,10 @@
 ##プログラムのコード
+```Python
 import numpy as np
 import pandas as pd
@@ -204,6 +208,8 @@
+```
 ### 発生している問題・エラーメッセージ

1

2020/05/22 09:32

投稿

スコア0

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -232,7 +232,7 @@
-プログラミングを習いたてでどう改善すればよいかわからないのでお願い致します
+プログラミングを習いたてでどう改善すればよいかわからないのでお願い致します。