本文是一篇电子商务论文,笔者综合本论文的研究,网购平台(商家)可以从产品评论、网购流程和广告三个方面优化其产品和服务,提高消费者的满意度和忠诚度,增加产品销量。
第一章 绪论
1.1 研究背景
网络市场匹配买卖双方、促进交易的职能大多数情况下通过网购平台如淘宝、天猫、京东、拼多多等实现,但是消费者在网购平台进行购物时,无法与商家进行面对面的交流,无法看到真实的产品。根据埃弗雷姆·特班等(2014)[1],消费者在网购平台购买产品时会经过如图1-1所示的过程。售前阶段,消费者会通过网购平台或其他渠道收集与产品相关的信息,包括查看其它消费者撰写的产品评论,以及浏览相关的广告,然后根据产品评论、广告中的内容判断产品是否满足需求,最后做出购买决策。售中阶段,消费者在网购平台完成选购、支付、安排配送等一系列过程。售后阶段,消费者根据收到的产品的使用情况申请售后服务(退换货、退款等)或对产品做出评价(评分、撰写产品评论)。商家根据购买情况衡量广告带来的实际效果,调整广告的投放策略。
图1.1会涉及到产品评论、网购流程(售前、售中、售后)、广告,以此引出以下三个关键问题:
① 产品评论摘要生成:挖掘产品评论中的关键信息,进而生成产品评论摘要,帮助商家高效理解海量产品评论中的主要内容,了解产品的优缺点。
② 网购流程优化:发现网购流程中存在的问题,提出网购流程优化策略,在售前、售中和售后各阶段为消费者提供更好的服务。
③ 有效和无效广告分类:提高有效广告识别率,帮助商家尽早移除无效广告,降低广告成本。
1.2 研究意义
本论文从产品评论摘要生成、网购流程优化以及有效和无效广告分类三个方面展开,研究具有理论和实践两个方面的重要意义。
1.2.1 理论意义
产品评论摘要生成方面,研究结合传统文本挖掘方法与深度学习模型的产品评论摘要生成方法,为产品评论内容挖掘的研究提供新的方法和思路。提出的摘要生成方法一方面保证摘要生成的信息在语法和语义上具有意义,且能反映产品的优缺点,另一方面能够自动归纳提取的信息,减少人工的干预,提高摘要生成的效率。
网购流程优化方面,结合文本挖掘技术和服务科学理论方法,对网购平台的网购流程进行评价和优化,扩展网购平台服务质量研究的方向、方法和思路。网购流程的优化有利于提高消费者的购物体验,规范对商家的管理,减少购物纠纷,而目前有关网购平台服务质量的研究没有从网购流程的角度出发,研究其存在的问题并提出优化策略。
有效和无效广告分类方面,建立广告分类模型,提高有效广告识别率,为广告效果评价的研究提供新的方法和思路。基于客观的业务数据的广告分类模型,能够一定程度避免当前广告效果评价的研究中数据样本量不足,数据偏性,主观性强,量化困难等问题,有效解决有效广告和无效广告的分类问题。
1.2.2 实践意义
产品评论摘要生成方面,提出的摘要生成方法能够根据海量产品评论生成反映产品优缺点的摘要。商家能够从中发现产品的受欢迎之处以及其有待改进之处,根据实际情况决定销售策略和补货策略;平台管理者能够根据分析结果对平台的产品进行管理,及时发现假冒或劣质产品,保证平台产品的质量。
网购流程优化方面,提出的优化方法能够为平台管理者评价和优化网购流程提供指导。一方面有利于营造良好的购物环境,提高消费者购物体验;另一方面有利于对商家的管理和规范,减少购物纠纷。
有效和无效广告分类方面,提出的分类模型能够提高有效广告识别率,一方面帮助商家尽早移除无效广告提供参考,节省成本,另一方面为消费者提供更为优质的广告,提高其购物体验。
第二章 文献综述
2.1 文本特征选择
研究发现,从特征选择的理念出发,文本特征选择方法可以分为“评分机制”、“筛选机制”以及“优化机制”三大类。基于“评分机制”的特征选择利用评分公式对每一个词进行单独的评价,然后选择排名靠前的词组成特征选择后的关键词集;基于“筛选机制”的特征选择首先利用评分公式对词进行评价,然后通过人为设定的方法得到关键词集;基于“优化机制”的特征选择利用最优化理论和方法得到关键词集。
2.1.1 基于“评分机制”的特征选择
基于“评分机制”的特征选择方法利用预先设计的评分公式对文本中每一个词进行独立评价,得出词的评分,获得高评分的词就是关键词。按照评分的高低,结合实际的情况如计算资源的限制,实际场景中对词数量的限制等,选择评分排在前面的𝑁个词组成关键词集。
为了方便叙述,首先做符号的规定:
规定1(基本元素)
𝑡:文本集合𝐷中的任意一个词 𝑐:类标签集合𝐶中的任意一个类 𝑐: 𝐶中除𝑐以外的所有类
规定2(条件概率)
𝑃(𝑡|𝑐):𝑡出现在属于𝑐的文本的概率 𝑃(𝑡|𝑐):𝑡出现在属于𝑐的文本的概率 𝑃(𝑡| 𝑐):𝑡不出现在属于𝑐的文本的概率 𝑃(𝑡|𝑐) :𝑡出现在不属于𝑐的文本的概率 𝑃(𝑡| 𝑐) :𝑡不出现在不属于𝑐的的文本的概率 𝑃(𝑐|𝑡):包含𝑡的文本属于𝑐的概率 𝑃(𝑐| 𝑡):包含𝑡的文本不属于𝑐的概率 𝑃(𝑐| 𝑡) :不包含𝑡的文本不属于𝑐的概率 𝑃(𝑡):𝑡在文本中出现的概率 𝑃(𝑐):属于𝑐的文本出现的概率
2.2 产品评论摘要相关技术研究
产品评论摘要生成包括关键信息提取和关键信息组织两个过程。关键信息提取过程从产品评论中提取反映产品优缺点的信息,即产品属性及其对应的情感评价组成的“(产品属性,情感评价)”词对。关键信息组织过程整合提取的关键信息,生成产品评论摘要。
2.2.1 关键信息提取
实现关键信息提取的方法可以是一次性将产品属性和情感评价同时提取出来并形成“(产品属性,情感评价)” 词对(一阶段方法),也可以是分别提取产品属性和情感评价,再将提取的产品属性和情感评价匹配起来,形成“(产品属性,情感评价)”词对(二阶段方法)。
2.2.1.1 一阶段方法
有研究利用简单的规则实现了“(产品属性,情感评价)” 词对的提取。沈炎军(2017)[79]以及刘柏嵩和赵福青(2015)[80]首先基于依存句法分析评论中词与词的依存关系,然后预定了了若干依存关系模板,最后根据模板直接从评论中提取“(产品属性,情感评价)”词对。马京苗(2017)[81]通过关联规则挖掘产品评论总结出频繁项集,形成相关的规则,然后通过情感评价匹配的方法得到“(产品属性,情感评价)”词对。唐晓波和兰玉婷(2016)[82]首先构建产品属性和情感评价的领域本体,然后利用相关方法计算情感评价和领域本体中的产品属性的大类的关联度,关联度高的大类与情感评价匹配起来,形成“(产品属性,情感评价)”词对。
第三章 基于深度学习的特征选择方法研究 ..................... 34
3.1 引言 ................................. 34
3.2 理论基础 ............................. 34
第四章 产品评论摘要生成方法研究 .............................. 77
4.1 引言 ................................... 77
4.2 基础理论 ........................... 77
第五章 基于文本挖掘和PCN的网购流程优化方法研究 ...............................111
5.1 引言 ......................................111
5.2 PCN的原理 .............................111
第六章 基于高斯滤波和决策树的广告分类模型研究
6.1 引言
商家会通过投放广告的方式吸引更多潜在消费者,提升销量。有效广告能够吸引更多潜在消费者,为商家带来更多的销量和利润,然而,无效广告不仅不能吸引消费者,而且增加了商家投放广告的成本。广告效果评价能够帮助商家识别有效广告和无效广告。
当前关于广告效果评价的研究存在局限性:采用的数据大多来源于访谈者对广告的主观感受、调查问卷等,可能会出现样本量不足,数据偏性,主观性强,量化困难等问题;没有从客观的业务数据(通过广告下订单总数、通过广告成功购买产品的总金额等)出发研究广告对商家的销售带来的实际效果,解决如何识别有效广告和无效广告的问题。针对上述问题,本论文基于业务数据,提出基于高斯滤波和决策树的广告分类模型M-GFDT(Model based on Gaussian Filterand Decision Tree)。
M-GFDT针对已经投放的广告,通过分析业务数据实现有效广告和无效广告的分类。广告的业务数据是量化数据,包含反映广告的业务能力的属性,例如,当天对广告产生行为的用户数量、当天通过广告产生购买行为的用户数量、当天通过广告购买产品的总金额、当天通过广告的下单数、当天通过广告浏览产品页面的数量等。广告的业务能力是指广告吸引消费者,引发产品购买的能力。业务数据是客观的量化数据,能够反映广告为商家的销售带来的实际效果,能够避免访谈、调研等导致的数据主观性和偏性,难以量化等问题,因此,以业务数据建立广告分类模型。
第七章 总结与展望
7.1 研究总结
本论文围绕文本特征选择、产品评论摘要生成、网购流程优化、广告分类模型四个方面展开研究。
(1)文本特征选择方法研究
提出了两种基于深度学习的特征选择方法:CNN-FS和LSTM-FS。两种方法利用文本数据训练深度神经网络,然后利用训练好的网络完成特征选择。CNN-FS采用的深度神经网络是一个三层的CNN和多层感知机的全连接层的组合,而LSTM-FS采用的深度神经网络是一个LSTM单元和全连接层的组合。实验结果证明了CNN-FS和LSTM-FS在文本特征选择方面的有效性。
(2)产品评论摘要生成方法研究
提出了结合词性、LDA主题模型、特征选择和深度学习模型的产品评论摘要生成方法。该方法利用词性规则、LDA主题模型、特征选择对产品评论中的信息进行筛选,保证提取的关键信息具备语法和语义两个方面的意义,同时能够反映产品的优缺点;利用深度学习模型LSTM网络对筛选后的信息进行总结和归纳,减少人工的干预,实现自动化摘要生成过程,提高摘要生成的效率。实验结果表明了提出的方法的有效性。
(3)网购流程优化研究
提出了网购流程优化方法。该方法首先利用第四章提出的产品评论摘要生成方法生成消费者投诉文本的摘要,进而分析网购平台存在的问题,包括客服人员不合格的服务行为,假货、商品损坏或有瑕疵,卖家虚假发或超时货、虚假宣传,以及物流空包和快递破损四个方面的问题;然后针对发现的问题,利用服务科学模型PCN描绘网购流程并提出了针对性的网购流程优化策略。最后,就如何有效实施提出的三个PCN优化策略提出建议,包括客服服务质量提升、售前商品管理以及商家发货管理三部分。
参考文献(略)
相关文章
UKthesis provides an online writing service for all types of academic writing. Check out some of them and don't hesitate to place your order.