之前的 Chat《从零开始,开发一款聊天机器人》描述了聊天机器人的开发过程,另一个 Chat《聊天机器人语言理解模块开发实践 》中讲述了让聊天机器人更加『人性化』的重要模块:语言理解(LU)模块的构建,LU 模型和训练算法。
但是大家都知道,模型的效果除了和算法相关,与数据更是大有关系,用于训练模型的语料和意图类型、实体类型的确定,往往会对模型的有效性和最终用户体验产生根本性的影响。
在已经存在用户与人工客服对话日志的情况下,日志中提取有代表性的客户问题,用以作为聊天机器人的语料,并通过聚类等手段获取用户问题之间的关联,是一种非常有效的途径。
作为『聊天机器人』系列的第三部,本场 Chat 将详细阐述应用聚类手段获取 chatbot 语料,并对构建 LU 模块提供参考的方法。
往期回顾:
从零开始,开发一款聊天机器人
聊天机器人语言理解模块开发实践
阅读全文: http://gitbook.cn/gitchat/activity/59fdcc13bf7e5232dd393b1e
您还可以下载 CSDN 旗下精品原创内容社区 GitChat App ,阅读更多 GitChat 专享技术内容哦。