自然语言处理NLP星空智能对话机器人系列:深入理解Transformer自然语言处理 Workshop on Machine Translation (WMT)
目录
Machine transductions and translations
- Machine transductions and translations
- Preprocessing a WMT dataset
- 星空智能对话机器人系列博客
机器翻译的评估表明了自然语言处理技术的进步,要确定一个解决方案比另一个更好,每个NLP挑战者,每个实验室,或者组织必须引用相同的数据集才能使比较有效。现在我们研究WMT数据集。
Vaswani et al. (2017) 在WMT 2014 English-to-German 翻译任务及WMT 2014 English-to-French 翻译任务上展示了Transformer的成就,Transformer获得了最先进的BLEU分数。
2014 Workshop on Machine Translation (WMT)包括欧洲语言数据集,其中一个数据集包含Europarl语料库。我们将使用来自European Parliament Proceedings Parallel Corpus语料库的French-English 数据集,链接网址是https://ww