keras lstm 层理解
最近一直在看 keras 的循环神经网络的lstm层。看了官方的document,和一些小伙伴的文章,一直都没有特别清楚。
今天看了这篇 文章,对RNN 有了一定的了解。
下面我以Nicholas_Jela这篇文章的代码 链接 为案例分析LSTM 层参数的设置
def build_model():
# input_dim是输入的train_x的最后一个维度,train_x的维度为(n_samples, time_steps, input_dim)
model = Sequential()
model.add(LSTM(input_dim=1, output_dim=6, return_sequences=True))
#model.add(LSTM(6, input_dim=1, return_sequences=True))
#model.add(LSTM(6, input_shape=(None, 1),return_sequences=True))
"""
#model.add(LSTM(input_dim=1, output_dim=6,input_length=10, return_sequences=True))
#model.add(LSTM(6, input_dim=1, input_length=10, return_sequences=True))
model.add(LSTM(6, input_shape=(10, 1),return_sequences=True))
"""
print(model.layers)
#model.add(LSTM(100, return_sequences=True))
#model.add(LSTM(100, return_sequences=True))
model.add(LSTM(100, return_sequences=False))
model.add(Dense(output_dim=1))
model.add(Activation('linear'))
model.compile(loss='mse', optimizer='rmsprop')
return model
下面三行代码是等价的
1. 输入维度 input_dim=1
2. 输出维度 output_dim=6
3. 滑动窗口 input_length=10
########################################################################
#model.add(LSTM(input_dim=1, output_dim=6,input_length=10, return_sequences=True))
#model.add(LSTM(6, input_dim=1, input_length=10, return_sequences=True))
model.add(LSTM(6, input_shape=(10, 1),return_sequences=True))
########################################################################
input_length=10,可不用输入,实际上数据再输入前,已经被加工成三维数组,如下图,train_x 是 106*10*1,的三维数组
########################################################################
model.add(LSTM(input_dim=1, output_dim=6, return_sequences=True))
#model.add(LSTM(6, input_dim=1, return_sequences=True))
#model.add(LSTM(6, input_shape=(None, 1),return_sequences=True))
########################################################################