編集履歴

質問編集履歴

修正

2020/09/29 05:19

投稿

EDM

スコア30

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -178,7 +178,7 @@
     next_prediction = model.predict(latest_x)
     next_prediction = scaler.inverse_transform(next_prediction)
     #予測結果を出力
-    print("次の当選番号の予測は: {}".format(e[round(next_prediction[0][0])]))
+    print("次の当選番号の予測は: {}".format(e[np.round(next_prediction[0][0])]))
     #測定時間を出力
     print("時間: {0:.1f}sec".format(time.time() - START_TIME))

7 514 1061 1326

修正

2020/09/29 05:18

投稿

EDM

スコア30

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -1,40 +1,29 @@
 pythonで機械学習、深層学習によって宝くじ当選番号予測プログラム　ロト7Versionを作っています。
 参考資料は[こちら](https://www.microstone.info/ai技術で宝くじ当選番号を予測、億万長者の夢を実/)
-下記のコードを実行するとこうなりました。
 （実行時は時間短縮のためself.epochsを1にしています。）
-Train Score: 0.223 RMSE
-Test Score: 0.216 RMSE
-次の当選番号の予測は: 3767366844416
-Time: 41.3sec
-質問内容としては
+整理整頓しました。
-当選番号の表示を第1数字,第2数字...とカンマ区切りで表示させたいのですが、うまくできません。データを一次元配列化しているからできないのでしょうか？
-また、本来ロト7の最大数値は37までなのですが、3767366844416　こちらをどこで区切ってもとてつもない数字になってしまいます。例えば　3,76,73 や　37,67,36のように　37以上表示されていると思いますがこれはおかしいですよね。機械学習、深層学習ってそういうものなんですか？
+質問
+個人的にパラメータの部分がよくわからないのですが、コメントのような理解でよろしいでしょうか？self.units = 6これについては何の意味があるのか　単位？単位が6？
 ロト７のcsvは[こちら](https://loto7.thekyo.jp/download/index)からダウンロードしています。ボーナス数字以下については使わないため、削除しています。
-もう一つ解決方法として思いついたのが
-現在第1～第7までの数値を一つに合体しているため、第1数字が一桁の場合、合体すると13桁の場合もあれば14桁の場合もあります。
-そこで、csvをロードしたときに、一桁の数字があれば、頭に0をつけるようにプログラムすれば全てが14桁になり、カンマ区切りで区別しなくともわかるようになると思います。
-”csvを読み込んだ後に頭に一桁があれば0をつける”
-こちらをプログラムで行うにはどのようにすればいいのでしょうか。
-excelで行う方法はいくつかありましたが、プログラムはわかりませんでした。
-個人的にパラメータの部分がよくわからないのですが、コメントのような理解でよろしいでしょうか？self.units = 6これについては何の意味があるのか　単位？単位が6？
 ```python
 #各インポート宣言
 #numpy 数値計算を効率的に行うためのライブラリ
 #pandas データ分析を効率的に行うためのライブラリ
 #tflearn 深層学習ライブラリ
 #time 時刻に関するさまざまな関数を提供
+#itertools 効率的なループ実行のためのイテレータ生成関数
 #sklearn 機械学習ライブラリ
 #preprocessing 前処理用のライブラリ
 import numpy as np
 import pandas as pd
 import tflearn
 import time
+import itertools
 from sklearn import preprocessing
 #予測LSTMクラス
@@ -43,16 +32,16 @@
         #LSTM訓練パラメータ
         #steps_of_history いくつ前のデータまでを学習に用いるか
         #steps_of_history いくつ先のデータを予測するか
+        #units よくわからない
         #epochs 一つの訓練データを何回繰り返して学習させるか
         #batch_size バッチサイズ
         self.steps_of_history = 10
         self.steps_of_future = 1
         self.units = 6
-        self.epochs = 100
+        self.epochs = 1
         self.batch_size = 1
-    #データセット作成
+     #データセット作成
     def create_dataset(self,data):
         x,y = [],[]
         for i in range(0,len(data) - self.steps_of_history,self.steps_of_future):
@@ -63,7 +52,7 @@
         y = np.reshape(np.array(y),[-1,1])
         return x,y
-    #予測データ作成
+        #予測データ作成
     def create_predict_dataset(self,data):
         latest_x = np.array([data[-self.steps_of_history:]])
         latest_x = np.reshape(latest_x,(-1,self.steps_of_history,1))
@@ -120,16 +109,28 @@
     #処理の速さを図る
     START_TIME = time.time()
-    #宝くじデータ読み込み
+    #1~37までの数字を用意
-    #csvファイルの第1数字から第7数字だけを読み込む
+    a = {m for m in range(1,38)}
+    d = {tuple(p): i for i, p in enumerate(itertools.combinations(a,7))}
+    e = {v: k for k, v in d.items()}
     dataframe = pd.read_csv("./loto7.csv",encoding='cp932')
     dataframe = dataframe[["第1数字","第2数字","第3数字","第4数字","第5数字","第6数字","第7数字"]]
+    data = dataframe.index.map(
+        lambda _:d[ tuple(sorted(
+            [(dataframe.第1数字[_]),
+            (dataframe.第2数字[_]),
+            (dataframe.第3数字[_]),
+            (dataframe.第4数字[_]),
+            (dataframe.第5数字[_]),
+            (dataframe.第6数字[_]),
+            (dataframe.第7数字[_])
+            ]
+            ))
+            ]
+        )
+    data = data.values.reshape(data.shape[0], 1).astype(dtype=np.float32)
-    #読み込んだデータを文字列に結合して数値型に変換
-    #データを一次元配列化　データタイプはfloat32
-    data = dataframe.index.map(lambda _:int(str(dataframe.第1数字[_]) + str(dataframe.第2数字[_]) + str(dataframe.第3数字[_]) + str(dataframe.第4数字[_]) + str(dataframe.第5数字[_]) + str(dataframe.第6数字[_]) + str(dataframe.第7数字[_])))
-    data = data.values.reshape(data.shape[0],1).astype(dtype = np.float32)
     #正規化
     #データが0~1に入るよう変換
     #fit_transform()について
@@ -172,12 +173,13 @@
     #予測
     #latest_xにcreate_predict_datasetの処理を正規化したデータを用いて行う
     #次の予測に訓練データをlatest_xを用いて行う
-    #次の予測に正規化のinverse_transformを”次の予測”を用いて行う
+    #予測に正規化のinverse_transformを”次の予測”を用いて行う
     latest_x = lstm.create_predict_dataset(data)
     next_prediction = model.predict(latest_x)
     next_prediction = scaler.inverse_transform(next_prediction)
+    #予測結果を出力
-    print("次の当選番号の予測は: {0:.0f}".format((next_prediction)[0][0]))
+    print("次の当選番号の予測は: {}".format(e[round(next_prediction[0][0])]))
-    #経過時間？の測定結果を出力
+    #測定時間を出力
-    print("Time: {0:.1f}sec".format(time.time() - START_TIME))
+    print("時間: {0:.1f}sec".format(time.time() - START_TIME))
 ```

7 514 1061 1326

追加

2020/09/28 08:28

投稿

EDM

スコア30

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -13,7 +13,14 @@
 ロト７のcsvは[こちら](https://loto7.thekyo.jp/download/index)からダウンロードしています。ボーナス数字以下については使わないため、削除しています。
+もう一つ解決方法として思いついたのが
+現在第1～第7までの数値を一つに合体しているため、第1数字が一桁の場合、合体すると13桁の場合もあれば14桁の場合もあります。
+そこで、csvをロードしたときに、一桁の数字があれば、頭に0をつけるようにプログラムすれば全てが14桁になり、カンマ区切りで区別しなくともわかるようになると思います。
+”csvを読み込んだ後に頭に一桁があれば0をつける”
+こちらをプログラムで行うにはどのようにすればいいのでしょうか。
+excelで行う方法はいくつかありましたが、プログラムはわかりませんでした。
 個人的にパラメータの部分がよくわからないのですが、コメントのような理解でよろしいでしょうか？self.units = 6これについては何の意味があるのか　単位？単位が6？
 ```python

7 514 1061 1326