NLP自然语言处理系列- week7-指针网络(Pointer Networks Refinements to Beam search)
目录
指针网络(Pointer Networks)论文
- 指针网络(Pointer Networks)论文
- RNN的问题
- 注意力机制模型
- 指针网络(Pointer Networks)
- 文本摘要应用
-
- 使用传统seq2seq模型
- 使用 Pointer-Generator模型
- 参考链接
https://arxiv.org/abs/1506.03134 我们引入了一种新的神经结构来学习输出序列的条件概率,这些元素是离散的符号,与输入序列中的位置相对应。这些问题不能用现有的方法(如序列到序列法和神经图灵机法)简单地解决,因为输出的每一步目标类的数量取决于输入的长度,而输入的长度是可变的。可变大小序列的排序问题以及各种组合优化问题都属于这类问题。我们的模型利用最近提出的神经注意机制解决了可变大小输出字典的问题。它与以前的注意力机制的不同之处在于,它不是使用注意力在每个解码器步骤中将编码器的隐藏单元混合到上下文向量中