新一代智能客服机器人为什么要机器人?客服工作中遇到的80%问题都是简单、重复、或无效的机器人可以大幅减少人力成本有效改善客服工作状态80%无效重复简单第一代问答机器人简单到不像是问问题被广泛应用基于单个简单的词的完全匹配回复x查询余额输入xxx获取活动信息咨询xxxx请按1…第二代问答机器人基于关键词的匹配技术仍然停留在词的层面,但有了一定的检索能力支持多个关键词,可以模糊查询比较死板,只适用于简单场景图书馆查询系统游戏精灵系统图书馆查询系统书名作者出版社摘要关键词游戏精灵系统职业装备任务副本活动第二代问答机器人场景简单用户问法明确、稳定、没什么变化用户明确应该怎样用什么词来检索关键词列表庞大影响匹配结果需要经验与技巧增加了人力成本第三代智能机器人在关键词匹配的基础上,引入了自然语言处理(NLP)的技术NLP意味着“智能”不再基于词,可以处理句子输入清洗预处理NLP分词词性标注识别关键词文法、句法权重匹配第三代智能机器人支持问法上一定的变化,但语义判断能力有限仍需维护问题库,弥补算法上的局限进步数量减少维护问题比词容易更接近人类真实的交流第四代智能机器人以神经网络为基础依托最新的深度学习技术结合模式识别等技术与第三代相比打破人工配置规则的束缚具有自主学习的能力更好的语义理解能力,处理更口语化、且多变的问法视觉系统的信息处理1981年诺贝尔医学奖DavidHubel(大卫·休伯尔)TorstenWiesel(托斯坦·维厄瑟尔)1958年猫的试验视觉系统的信息处理像素边缘形状物体稀疏编码算法1995年,通过计算机的方法研究视觉问题BrunoOlshausen(布鲁诺·奥尔斯豪森)DavidField(大卫·菲尔德)提取图像碎片稀疏编码算法BrunoOlshausen&DavidField算法的结果DavidHubel&TorstenWiesel生物试验的结果不谋而合!特征复杂的图形都是由简单的结构组合而成的这些简单的结构(比如说物体的边缘),就是一种特征抽象的过程,就是在提取特征底层的特征组合后产生了上一层的特征逐层迭代分层模型每一层都是一系列的特征输入的信息用这一层的特征变换了一个表达方式这种表达进入下一层,就被下一层的特征来描述深度学习自主学习发现特征深度模型是手段,特征学习是目的更深的层次层次越多学习能力越强特征描述越准确WordEmbedding一种描述词的特征的技术用一个多维向量来描述一个词每一个分量表示一个特征分量的值表示特征的权重通俗理解,词向量将深度学习的技术应用在了刻画词的特征方面WordEmbedding计算两个词的相似度等价于计算n维空间中两个向量的欧氏距离或者夹角WordEmbedding:词→句→语义→意图SentenceEmbedding:句→语义→意图首层抽象特征的准确性,对整个模型的效果起着至关重要的作用学习方法深度模型、算法怎么学?教材训练的输入学什么?用工程度特征层数学习成绩?人类学习深度学习网易七鱼优势熟悉客服业务,深刻理解客户服务场景有成熟的、经过验证成功的学习方法有累积超过10年的专业领域的学习教材自研深度模型提供更深学习层次Pipeline技术将深度学习与传统方法相结合庞大的集群支撑计算开销DLDNNNLP检索指令匹配