cs224u 自然语言推理:任务和数据集-2 nli_01_task_and_data.ipynb
__author__ = "Christopher Potts"
__version__ = "CS224u, Stanford, Fall 2020"
目录
MultiNLI 属性
-
- MultiNLI 属性
- SNLI 和 MultiNLI
-
五种类型的训练:
- 小说:创作于1912-2010年,跨越多种体裁
- 政府:来自政府网站的报告、信件、演讲等
- The Slate website
- 电话:总机语料库
- 旅游:Berlitz旅游指南
-
额外的类型只是为了开发和测试(不匹配的条件):
- 9/11的报告
- 《面对面:夏洛特叙事与对话集》
- 筹款信
- 非小说,牛津大学出版社
- 关于语言学的逐字逐句的文章
-
392702个训练集数据;20K验证集;20K测试集
-
19,647个示例由另外四个注释器验证