长短时记忆神经网络模型(LSTM)简介

下载本文档

阅读 169
下载 13
格式 docx
大小 122.4 KB
约7页
2024-12-29 发布于天津市
收藏
评论
点赞(0)
海报
举报

1/7页

2/7页

3/7页

在线预览已结束，请下载后查看完整版，加入VIP享文档下载特权

文本预览下载提示常见问题

5.1.1LSTM 模型概述长短时记忆网络是一种深度学习方法，目前是机器学习领域中应用最广泛的模型，并在科技领域有了众多应用。在 2015 年，谷歌通过LSTM 模型大幅提升了安卓手机和其他设备中语音识别的能力，之后谷歌使用 LSTM 的范围更加广泛，它可以自动回复电子邮件，生成图像字幕，同时显著地提高了谷歌翻译的质量；苹果的 iPhone 也在QucikType 和 Siri 中使用了 LSTM；微软不仅将 LSTM 用于语音识别，还将这一技术用于虚拟对话形象生成和编写程序代码等等[56]LSTM 算法全称为 Longshort-termmemory,最早由 SeppHochreiter和 JurgenSchmidhuber 于 1997 年提出[57]，是一种特定形式的循环神经网络(RNN,Recurrentneuralnetwork,),而循环神经网络是一系列能够处理序列数据的神经网络的总称。RNN 在处理时间序列上距离较远的节点时会发生梯度膨胀和梯度消失的问题，为了解决 RNN 的这个问题，研究人员提出基于门限的 RNN(GatedRNN),而 LSTM 就是门限 RNN中应用最广泛的一种，LSTM 通过增加输入门(InputGate),输出门(OuputGate)和遗忘门(ForgetGate)，使得神经网络的权重能够自我更新，在网络模型参数固定的情况下，不同时刻的权重尺度可以动态改变，从而能够避免梯度消失或者梯度膨胀的问题。LSTM 的结构中每个时刻的隐层包含了多个记忆单元(MemoryBlocks),每个单元(Block)包含了多个记忆细胞(MemoryCell),每个记忆细胞包含一个细胞(Cell)和三个门(Gate)[58],一个基础的 LSTM 结构示例如图 5-1 所示：FargctGate其BlocOutpuInputGat&图 5-1LSTM 的基础结构[58]一个记忆细胞只能产出一个标量值，一个记忆单元能产出一个向量丄 STM 的算法包括两个部分:1.LSTM 的前向传播(ForwardPass),用于解决已知 LSTM 输入如何得到输出的问题;2.LSTM 的反向传播(BackwardPass)，用于更新 LSTM 中每个权重的梯度，解决 LSTM 的训练问题。5・1・2LSTM 的前向传播算法本文应用最基础的 LSTM 结构来进行公共自行车出行链出行目的需求预测，该模型每个时刻的隐含层只包括一个记忆单元，每个记忆单元只包含一个记忆细胞。LSTM 的前向传播算法从输入开始，逐个求解输入门、遗忘门、细胞门和输出门，求解过程如图 5-2 所示：Input

~~查看更多~~

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

~~碎片内容~~