本文是一篇电子商务论文,本文设计了基于LSTM的孪生属性注意力网络(SiameseATT)用于候选属性选择,SiameseATT网络大大提高了商品智能问答中属性选择的性能。其次,我们通过知识图谱的本体规则推理,将多跳属性转换为1跳属性,解决了复杂的多跳属性问答的问题。
1.绪论
1.1 电子商务及其客户服务
随着互联网的迅速普及和信息技术的不断创新,整个人类社会进入了互联网经济时代。与此同时,在消费领域,基于互联网技术的电子商务(Electronic Commerce)已逐渐改变了人们的生活习惯和购物方式,越来越多的人开始使用网上购物。电子商务发展至今不过20年,却给我们的生活带来了翻天覆地的变化。
电子商务是指以电子化的方式实现整个商贸过程的各阶段的活动,包括供应链管理、电子支付、电子交易市场、在线营销、在线交易处理和电子数据交换等[1]。近年来,许多电子商务企业,例如淘宝(www.taobao.com)、京东(www.jd.com)、拼多多(www.pinduoduo.com)和亚马逊(www.amazon.com)等飞速发展,逐渐占领消费市场并获得了巨大的成功。电子商务因其低成本、高效率和便利性,成为经济增长的新动力[1]。特别是最近十年,我国电子商务行业持续保持两位数的高速增长。据网经社“电数宝”电商大数据库(DATA.100EC.CN)显示1 (如图1-1所示),2019年国内网络零售市场交易规模达10.32万亿元,较2018年的8.56万亿元,同比增长20.56%。与此同时,2019年国内网络零售用户规模达7.32亿人,较2018年的5.7亿人,同比增长28.42%。
1.2 面向电子商务的智能客户服务
近年来,面对日益增加的网购用户和在线商品,诸如淘宝、京东、拼多多和亚马逊等国内外大型电子商务企业启用了大量人力、物力、财力和信息系统来支撑客户服务。然而,电子商务客户服务的一些问题依然不可避免地出现,例如服务支撑可用性有限、效率低下和成本高昂等[2]。具体而言,主要面对如下几个突出问题:
1、如何及时、准确和低成本地回答用户问题?
在线购物时,用户为快速了解商品的详细信息,常常会提出一些关于商品的问题,如“这款小米手机内存多大?这款打底衫是什么材质的?”等。许多商家都招聘了一定数量的客户服务人员来在线解答这些问题。但实际上,用户提出的问题大部分是重复的,许多高频问题会经常被询问。因此,如果全由客服人员回答这些重复的问题是一项费时耗力的工作。同时,企业需要招聘大量的人员来回答这些问题,这种方式大大增加了企业服务成本。另一方面,由于有些咨询问题较为专业,许多客服人员也无法快速准确地回复,由此影响了商品的销售和用户的体验。再者,当某些节假日临近或商家促销时,购物的客流量会出现大幅激增,由于客服人员接待能力有限,此时便会出现许多用户无人接管的情况,从而白白失去大量的销售机会。同样地,客户服务人员也无法7×24小时不间断工作,在夜间或其他休息时间的用户咨询问题也没法及时回答,从而导致用户流失。因此,如何及时、准确和低成本地回答用户的问题是电子商务客户服务当前所面临的一个挑战2。
2、如何向用户推荐合适的商品?
电子商务网站存在成千上万的商品,面对这些琳琅满目的商品,许多用户会出现选择困难,无从下手的情况。另外,由于商品众多,一些新上市商品也不能第一时间被用户发现,从而失去了大量销售的机会。因此,如何为用户推荐合适的商品成为电子商务企业销售中至关重要的一环,同时也是客户服务人员的重要工作之一。恰当地向用户推荐商品,既可以增加企业的销售量,又可以提高用户的满意度。在传统的线下购物中,许多商家都会雇佣专业的导购人员来推销商品。他们具有丰富的销售经验,会根据用户的要求和实际情况适时地向用户进行推销。但在电子商务中,网络购物的用户与客户服务人员无法进行面对面沟通和交流,这导致客服人员对用户的实际情况了解较少,很难做出合适地商品推荐。另一方面,在线商品众多,客服人员很难准确地进行推荐。因此,如何向用户推荐合适的商品成为电子商务客户服务面对的一个关键问题。
2.基于知识图谱和规则推理的商品智能问答模型
2.1 引言
近年来,随着互联网的发展,网上购物已逐渐成为人们生活购物的一种主要方式。在线下购物时,用户通常向客服人员面对面地咨询各类商品问题,通过客服人员的介绍,用户可以先充分了解商品的信息再做出购买决策。同样地,在线购物时用户也常常会对商品提出一系列咨询问题,例如“这款小米手机的内存多大?”,“这款格力空调每小时耗电多少?”等。一般来说,电子商务企业都有在线客户服务人员,用户可通过发送图片、文字或语音的方式与在线客服人员交流沟通商品问题。然而,这些咨询问题很大部分是重复的,全由人工来回答这些重复的问题是一件非常耗时耗力的工作。另一方面,一些比较专业的问题要求在线客服人员具有较高的专业素养,例如用户咨询商品的某些技术参数、适配环境等问题。显然,大部分客服人员很难准确无误地记忆各种商品参数,特别是在商品较多或更新较为频繁时。在这样的情况下,许多电子商务企业希望能够通过商品智能问答系统来减少客服人员成本,同时提高问题回答的准确率。因此,商品智能问答系统具有很高的应用价值和研究价值。
在目前的应用中,许多在线商品智能问答系统是通过意图识别(用户问题识别)和人工的答案配置来实现的。意图识别本质上是一个文本分类任务,它需要训练一个文本分类器来识别“用户问题”所表达的意图,接着,通过人工对每个意图配置固定的答案来实现商品的智能问答。总而言之,基于意图识别的商品智能问答使用较为灵活多样、可定制性强且方法简单可靠。正因如此,如今许多小型电商企业常采用这种方法来实现商品智能问答。但该方法也存在一些不足,例如答案的配置过度依赖人工,对于同样的意图(问题)需要对每个商品单独配置答案。因此,对商品比较多的大型电商企业而言,这种方法需要的配置工作量巨大,实用性较差。另外一些研究则尝试通过评论中的内容来解答用户的问题。他们通过检索式的方法找到评论中与问题最相关的部分,随后将这部分内容作为用户问题的答案。与意图识别的方法相比,这种方法不需要人工配置答案,但需要依赖一定数量的高质量的商品评论。然而,在实际中许多商品不仅没有大量的高质量评论,甚至很多商品鲜有评论。因此,这类方法在应用中也存在很大的局限性。近年来,随着知识图谱技术的发展,基于知识图谱的商品智能问答逐渐成为研究的热点。基于知识图谱的方法不需要配置答案,也不需要依赖高质量的评论,答案来自于知识图谱。因此,这种方法相对于其他方法而言更为实用和高效,近年来被广泛地使用在电子商务的商品智能问答中。
2.2 商品智能问答研究现状
众所周知,商品智能问答在大型电商企业中已得到广泛的应用,例如“阿里小蜜”、“百度小度”和“京东JIMI”等。这些商品智能问答系统能够自动回复用户的问题,从而大大提高了商家的接待能力,降低了人力成本,并实现了7×24小时不间断服务。总体来讲,商品智能问答不同于其他开放域的智能问答,它的回答内容控制在商家所售商品领域,对于其他的闲聊问题并不作答,是一种限定域的问答系统。相较于其他智能问答,商品智能问答更要求答案的准确率和专业性。目前对商品智能问答的研究主要分为以下3类:基于意图识别和答案配置的智能问答、基于知识图谱的智能问答和基于评论的智能问答。
2.2.1 基于意图识别和答案配置的商品智能问答
如前文所述,一些中小型电子商务企业广泛使用的在线商品智能问答主要是通过意图识别和人工答案配置来实现的。意图识别本质上是一个文本分类任务(Question Classification),该算法能够根据用户提问的直接或者间接的信息来判断用户的真实意图。在识别用户意图后,再将事先由人工配置的意图所对应的答案话术发送给咨询用户,即可实现智能问答。由此可见,该方法的重点和难点在于意图识别。目前意图识别的方法主要包括基于规则和人工特征工程的方法以及基于深度学习的方法。
3.基于知识图谱的商品搭配推荐模型 ............................... 50
3.1 引言 ................................. 50
3.2 商品搭配推荐系统研究现状 ................................ 53
4.基于外部记忆网络的评论有用性预测模型 ......................... 79
4.1 引言 ........................... 79
4.2 评论有用性预测研究现状 .................................. 83
5.基于联合注意力机制的评论方面类别检测模型 .................... 104
5.1 引言 ................................................... 104
5.2 评论方面类别检测研究现状 ............................... 106
5.基于联合注意力机制的评论方面类别检测模型
5.1 引言
近年来,情感分析和评论挖掘已成为学术界和工业界的热门研究领域。如前文所述,在评论的意见挖掘中,我们面对的一个挑战就是如何将标签(类别)准确的分配给评论中的各个方面,这个工作称为“方面类别检测”(Aspect Category Detection ,ACD)。例如,一句这样的评论“这个餐厅的服务真的很好!” ,我们可以为其指定一个方面类别“服务”。而另一句评论“餐厅的服务员非常好,但菜也真的不错!”,这条评论我们可以为其分配两个类别,即“服务和食品”。可以看见,方面类别检测任务可以从评论中抽取更细腻度的意见,从而帮助公司改进其产品或帮助用户快速检索感兴趣的评论内容。
目前的研究把评论方面类别检测任务的方法分为了三类:无监督的方法、有监督的方法和半监督的方法。无监督的方法主要是利用词典、规则或聚类的方法来完成。其中基于词典的方法[165]主要结合意见词典(如“精彩”、“昂贵”)和某些语法规则来执行任务。基于词典的方法简单有效且不需要标记数据集,但需要预先设计规则和建立词典,因此该方法不能很好地处理那些包含隐含语义的或较为复杂的句子。近年来,在评论方面类别检测的研究中基于机器学习的方法逐渐兴起,例如SVM[166]、神经网络模型[167]等方法在评论方面识别任务中均取得了不错的效果。机器学习的方法是有监督的方法,虽然有监督的方法能获得较好的效果,但该方法需要大量的人工标记的数据,因此一些半监督学习方法被应用于评论方面类别检测中。
6.全文总结与展望
6.1 全文工作总结
近年来,随着互联网技术的出现和发展,电子商务已成为人们购物和生活不可或缺的一部分。电子商务企业秉承以客户和产品为中心的理念,因此在电子商务中客户服务是其至关重要的一个环节。近年来,许多电子商务企业将人工智能和大数据等智能技术与电子商务客户服务紧密地结合,使得电子商务客户服务更为智能化和自动化,由此迈入了智能客户服务的时代。然而,面对日益激增的用户群体和海量的商品,智能客户服务也直面许多挑战。本文在这样的时代背景下,从电子商务客户服务所面对业务问题入手,调研当前已存在的解决方案(智能技术),重点对其中的关键技术进行分析和研究,主要包括:商品智能问答、商品搭配推荐、评论有用性预测和评论方面类别检测等4个关键技术。进一步,在相关理论和数据的支撑下,对这些关键技术进行改进和优化,最后在真实的电子商务数据集中对研究的方法进行验证。本文的研究工作主要包括:
1、针对目前知识图谱的商品智能问答存在的问题,本文提出一种基于知识图谱和本体规则推理的商品智能问答模型。
首先,本文设计了基于LSTM的孪生属性注意力网络(SiameseATT)用于候选属性选择,SiameseATT网络大大提高了商品智能问答中属性选择的性能。其次,我们通过知识图谱的本体规则推理,将多跳属性转换为1跳属性,解决了复杂的多跳属性问答的问题。最后,在NLPCC-ICCPOL 2016问答数据集的实验证明了基于这种孪生属性注意力网络在属性选择上比大部分基线模型展现出更好的性能,并且该方法也更适合电商应用场景。随后,本文又利用淘宝网中的家电类商品数据构建了一个商品智能问答的原型系统。该原型系统展现了通过知识图谱规则推理实现动态生成实体属性,从而解决了多跳属性问答的问题。最终,实验也证明了规则推理的方法能大大提升问答系统的性能。
2、针对商品搭配推荐中存在的问题,本文提出一种基于知识图谱的搭配推荐模型,充分利用了电子商务中商品的标题以及网站中其他可访问的辅助信息用于提升搭配推荐的性能。
首先,本文根据商品的购买数据和类别信息构建了一个名为ItemKG的知识图谱,接着设计了TransH的变体来学习ItemKG中每个商品和类别的知识图谱嵌入。另外,根据在线商品的中文标题的特点,本文开发了一种标题编码模型(TEM)来处理中文标题并提取特征向量,随后构建了一个基于深度神经网络的搭配模型(FIRM),该模型结合了从ItemKG中学习到的商品和类别的知识图谱嵌入以及通过标题编码模型而获得标题向量,用于计算查询商品和候选商品之间的商品搭配概率。随后,在真实的电商搭配数据集TIANCHI和POG中的实验表明,该模型性能较基线模型有大幅提升,同时通过消融实验证明知识图谱对模型的积极影响。
参考文献(略)
相关文章
UKthesis provides an online writing service for all types of academic writing. Check out some of them and don't hesitate to place your order.