質問編集履歴

大幅に質問内容を変更しました

2017/12/22 09:13

投稿

kamome01

スコア16

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -1,329 +1,4 @@
 ###前提・実現したいこと
 Kerasのライブラリを使い，GRUに複数の時系列データを学習させたいのですが手段がわかりません．
 現在は，時系列データを１パターンだけ学習させ，テストデータを与えるところまでは出ています．
-具体的には，時系列データのdatファイルが30個あり，15個を学習データ，15個をテストデータとして用いたいのです．
+具体的には，時系列データのdatファイルが30個あり，15個を学習データ，15個をテストデータとして用いたいのです．
-###該当のソースコード
-```python
-import numpy as np
-import matplotlib.pyplot as plt
-from keras.models import Sequential
-from keras.layers.core import Dense, Activation
-from keras.layers.recurrent import GRU
-from keras.optimizers import Adam
-from keras.callbacks import EarlyStopping
-from sklearn.model_selection import train_test_split
-import os
-np.random.seed(0)
-def zscore(x, axis = None):
-    xmean = x.mean(axis=axis, keepdims=True)
-    xstd  = np.std(x, axis=axis, keepdims=True)
-    zscore = (x-xmean)/xstd
-    return zscore
-def read(N=10, T=200):
-    a=np.loadtxt('pre10.dat',delimiter=' ',usecols=0)
-    b=np.loadtxt('pre10.dat',delimiter=' ',usecols=3)
-    c=np.loadtxt('pre10.dat',delimiter=' ',usecols=1)
-    d=np.loadtxt('pre10.dat',delimiter=' ',usecols=2)
-    a=zscore(a)
-    c=zscore(c)
-    d=zscore(d)
-    signals = np.zeros((N,T))
-    for i in range(N):
-        signals[i] = a[i]
-    sig2=np.zeros((N,T))
-    for i in range(N):
-        sig2[i] = c[i]
-    sig3=np.zeros((N,T))
-    for i in range(N):
-        sig3[i] = d[i]
-    masks = np.zeros((N, T))
-    for i in range(N):
-        masks[i] = b[i]
-    data = np.zeros((N, T, 3))
-    data[:, :, 0] = signals[:]
-    data[:, :, 1] = sig2[:]
-    data[:, :, 2] = sig3[:]
-    target = np.zeros((N,T))
-    for i in range(N):
-        target[i]=b[i]
-    return (data, target)
-def read_test(N=10, T=200):
-    a=np.loadtxt('pre14.dat',delimiter=' ',usecols=0)
-    c=np.loadtxt('pre14.dat',delimiter=' ',usecols=1)
-    d=np.loadtxt('pre14.dat',delimiter=' ',usecols=2)
-    a=zscore(a)
-    c=zscore(c)
-    d=zscore(d)
-    signals = np.zeros((N,T))
-    for i in range(N):
-        signals[i] = a[i]
-    sig2=np.zeros((N,T))
-    for i in range(N):
-        sig2[i] = c[i]
-    sig3=np.zeros((N,T))
-    for i in range(N):
-        sig3[i] = d[i]
-    data = np.zeros((N, T, 3))
-    data[:, :, 0] = signals[:]
-    data[:, :, 1] = sig2[:]
-    data[:, :, 2] = sig3[:]
-    return (data)
-'''
-モデルファイル用設定
-'''
-MODEL_DIR = os.path.join(os.path.dirname(__file__), 'model')
-if os.path.exists(MODEL_DIR) is False:
-    os.mkdir(MODEL_DIR)
-'''
-データの読み取り
-'''
-N = 13999
-T = 200
-maxlen = T
-X, Y = read(N=N, T=T)
-X_test=read_test(N=N,T=T)
-N_train = int(N * 0.9)
-N_validation = N - N_train
-'''
-モデル設定
-'''
-n_in = len(X[0][0])  # 2
-n_hidden = 100
-n_out = len(Y[0])  # 1
-def weight_variable(shape, name=None):
-    return np.random.normal(scale=.01, size=shape)
-early_stopping = EarlyStopping(monitor='loss', patience=100, verbose=1)
-kernel=weight_variable
-kernel2=weight_variable
-model = Sequential()
-model.add(GRU(n_hidden,
-              #kernel_initializer=kernel,
-              input_shape=(maxlen, n_in)))
-model.add(Dense(n_out))
-model.add(Activation('linear'))
-optimizer = Adam(lr=0.001, beta_1=0.9, beta_2=0.999)
-model.compile(loss='mean_squared_error',
-              optimizer=optimizer)
-'''
-モデル学習
-'''
-epochs = 1000
-batch_size = 100
-hist = model.fit(X, Y,
-                 batch_size=batch_size,
-                 epochs=epochs,
-                 callbacks=[early_stopping])
-model.save(MODEL_DIR+'/model_relu.hdf5')
-print('Model saved')
-'''
-学習の進み具合を可視化
-'''
-loss = hist.history['loss']
-plt.figure(1)
-plt.rc('font', family='serif')
-plt.plot(range(len(loss)), loss, label='loss', color='black')
-plt.xlabel('epochs')
-predicted = model.predict(X_test)
-A = np.loadtxt('pre14.dat',delimiter=' ',usecols=0)
-A=zscore(A)
-plt.figure(2)
-plt.ylim([-3, 3])
-plt.plot(A, color='#aaaaaa')
-#plt.plot(B,color='black' )
-plt.plot(predicted, color='red')
-plt.show()
-#plt.savefig(__file__ + '.eps')
-```
-###試したこと
-https://teratail.com/questions/105989　で回答を頂いたように，
-```
-dat_paths = glob.glob("pre*.dat")
-a = [np.loadtxt(dat_path,delimiter=' ',usecols=0)for dat_path in dat_paths]
-b = [np.loadtxt(dat_path,delimiter=' ',usecols=3)for dat_path in dat_paths]
-c = [np.loadtxt(dat_path,delimiter=' ',usecols=1)for dat_path in dat_paths]
-d = [np.loadtxt(dat_path,delimiter=' ',usecols=2)for dat_path in dat_paths]
-```
-上記のように読み込み関数を書き換えたのですが，これだけではそれ以降の処理でエラーが出るのと，なにより複数サンプル学習させる方法として正しいのかわかりません．
-ちなみに，他にも少し書き換えているのでコードの全容を載せておきます
-```
-import numpy as np
-import matplotlib.pyplot as plt
-from keras.models import Sequential
-from keras.layers.core import Dense, Activation
-from keras.layers.recurrent import GRU
-from keras.optimizers import Adam
-from keras.callbacks import EarlyStopping
-from sklearn.model_selection import train_test_split
-from sklearn.utils import shuffle
-import os
-import glob
-np.random.seed(0)
-def zscore(x, axis = None):
-    xmean = x.mean(axis=axis, keepdims=True)
-    xstd  = np.std(x, axis=axis, keepdims=True)
-    zscore = (x-xmean)/xstd
-    return zscore
-def read(N=10, T=200):
-    dat_paths = glob.glob("pre*.dat")
-    A = [np.loadtxt(dat_path,delimiter=' ',usecols=0)for dat_path in dat_paths]
-    b = [np.loadtxt(dat_path,delimiter=' ',usecols=3)for dat_path in dat_paths]
-    C = [np.loadtxt(dat_path,delimiter=' ',usecols=1)for dat_path in dat_paths]
-    D = [np.loadtxt(dat_path,delimiter=' ',usecols=2)for dat_path in dat_paths]
-    #a=np.loadtxt('*.dat',delimiter=' ',usecols=0)
-    #b=np.loadtxt('*.dat',delimiter=' ',usecols=3)
-    #c=np.loadtxt('*.dat',delimiter=' ',usecols=1)
-    #d=np.loadtxt('*.dat',delimiter=' ',usecols=2)
-    signals = np.zeros((N,T))
-    for i in range(N):
-        signals[i] = a[i]
-    sig2=np.zeros((N,T))
-    for i in range(N):
-        sig2[i] = c[i]
-    sig3=np.zeros((N,T))
-    for i in range(N):
-        sig3[i] = d[i]
-    masks = np.zeros((N, T))
-    for i in range(N):
-        masks[i] = b[i]
-    data = np.zeros((N, T, 3))
-    data[:, :, 0] = signals[:]
-    data[:, :, 1] = sig2[:]
-    data[:, :, 2] = sig3[:]
-    target = np.zeros((N,T))
-    for i in range(N):
-        target[i]=b[i]
-    return (data, target)
-'''
-モデルファイル用設定
-'''
-MODEL_DIR = os.path.join(os.path.dirname(__file__), 'model')
-if os.path.exists(MODEL_DIR) is False:
-    os.mkdir(MODEL_DIR)
-'''
-データの読み取り
-'''
-N = 500000
-T = 200
-maxlen = T
-X, Y = read(N=N, T=T)
-N_train = int(N * 0.9)
-N_validation = N - N_train
-X_train,X_test,Y_train,Y_test=\
-    train_test_split(X,Y,train_size=train_size)
-X_train,X_validation,Y_train,Y_validation= \
-    train_test_split(X_train,Y_train,train_size=N_validation)
-'''
-モデル設定
-'''
-n_in = len(X[0][0])  # 2
-n_hidden = 100
-n_out = len(Y[0])  # 1
-def weight_variable(shape, name=None):
-    return np.random.normal(scale=.01, size=shape)
-early_stopping = EarlyStopping(monitor='loss', patience=100, verbose=1)
-kernel=weight_variable
-kernel2=weight_variable
-model = Sequential()
-model.add(GRU(n_hidden,
-              #kernel_initializer=kernel,
-              input_shape=(maxlen, n_in)))
-model.add(Dense(n_out))
-model.add(Activation('linear'))
-optimizer = Adam(lr=0.001, beta_1=0.9, beta_2=0.999)
-model.compile(loss='mean_squared_error',
-              optimizer=optimizer)
-'''
-モデル学習
-'''
-epochs = 1000
-batch_size = 100
-hist = model.fit(X_train, Y_train,
-                 batch_size=batch_size,
-                 epochs=epochs,
-                 validation_data=(X_validation,Y_validation),
-                 callbacks=[early_stopping])
-model.save(MODEL_DIR+'/model_GRU.hdf5')
-print('Model saved')
-'''
-学習の進み具合を可視化
-'''
-val_loss=hist.history['val_loss']
-val_acc=hist.history['val_acc']
-loss_and_metrics=model.evaluate(X_test,Y_test)
-print(loss_and_metrics)
-plt.figure(1)
-plt.plot(range(len(val_acc)),val_acc,label='acc',color='red')
-plt.xlabel('epochs')
-plt.figure(2)
-plt.plot(range(len(val_loss)),val_loss,label='loss',color='red')
-plt.xlabel('epochs')
-plt.show()
-```

タグの編集

2017/12/22 09:13

投稿

kamome01

スコア16

title CHANGED Viewed

File without changes

body CHANGED Viewed

File without changes