本文是一篇金融论文,本文探讨了创新信息载荷对股票收益的影响。首先通过回归分析检验创新信息载荷对股票收益的影响,结果发现创新信息载荷对股票收益存在显著正向影响,在加入控制变量后的回归拟合程度也有所提高,通过投资组合分析也得出相同结论,这说明创新信息载荷越高的企业,股票回报越高,通过创新信息载荷进行买多做空的投资组合能够赚取额外的超额收益。
第一章绪论
1.1研究背景及研究意义
1.1.1研究背景
自21世纪以来,全球进入了信息时代,这使得传统经济逐渐向知识经济转型。知识经济是指在现代经济中,知识的创造、获取、传播和利用成为经济增长和社会进步的主要驱动力量。在知识经济时代,企业创新已然成为企业持续发展的关键因素之一。首先。企业创新可以帮助企业获得更多的知识资产,从而提高企业的竞争力,赢得更多的市场份额。其次,在知识经济时代,市场变化非常快,企业必须能够及时适应市场变化,否则就会被市场淘汰,企业创新可以帮助企业及时把握市场机会,适应市场变化,保持市场竞争力。第三,知识经济时代下的企业必须具备高效率和高质量的生产能力,企业通过创新可以引进先进的生产技术和生产工具,提高生产效率和质量,从而降低成本,提高利润。最后,企业通过创新可以退出具有竞争力的新产品或服务,树立企业的良好形象,提高品牌价值,吸引更多的顾客和投资者。种种表明在知识经济时代,企业创新是企业持续发展的必要条件之一,只有不断创新,才能不断提高企业的竞争力和市场份额,适应市场变化,提高生产效率和质量,树立企业形象和品牌价值,保持企业的持续发展。
世界知识产权组织日前发布的《世界知识产权指标》报告显示,虽然2020年全球经济受到新冠疫情的冲击,但2020年全球知识产权申请活动依然强劲。其中,中国创新主体专利申请量超过140余万件,专利、商标、植物新品种申请量均居世界首位,呈现强劲增长态势。在信息通信技术领域,数字通信、计算机技术和信息管理等方向的专利申请量显著增长,其中,计算机技术专利申请量居科技领域首位。但随着专利数量的增长,提高技术质量也尤为重要。从2019年美国制裁中兴通讯事件,再到2020年华为事件、2021年格力事件,这都在提醒我们创新是企业的生命线,企业只有注重提升创新研发的速度与把握创新成果的质量,才能发挥创新的最大价值,真正实现创新成果市场化,进而拉动企业向高质量发展转型。据世界知识产权组织统计,专利文献中包含90%~95%的创新研发成果,80%以上独特创新公开技术未出现在其他专利文献里,全球90%以上的发明创造首先通过专利文件表现出来;专利文献反映前沿科技的信息和数据,可以作为科学研究的参考,为研究者提供重要资源库;对专利信息进行有效利用能够节约60%以上的研发时间,降低40%的研发成本,种种数据都表明专利信息具有重要意义。
1.2研究思路
1.2.1研究内容
首先本文以我国信息行业上市公司为研究对象,选择2005-2020年的专利文本摘要内容通过文本挖掘计算其创新信息载荷,并基于创新信息载荷度量我国信息行业上市公司的创新水平,并以实例分析其创新水平与股票收益的关系。紧着分别采用回归分析法及投资组合分析法检验创新信息载荷与股票收益的关系,并通过Fama-French三因子模型与五因子模型检验创新信息载荷-股票收益效应是否源自风险。最后,基于创新信息载荷构建创新信息因子,并检验创新信息因子是否为冗杂因子;同时,在Fama-French三因子模型或五因子模型中加入创新信息因子并进行GRS检验,分析加入创新信息因子后的资产定价效率。基于上述思路,本文分为七个章节,内容如下:
第一章:绪论;首先介绍本文研究背景,并从不同角度说明本文的研究意义,确定研究思路,接着对本文的主要内容、技术路线、研究方法作出详细说明,最后总结本文的创新之处,为后文的研究做基础。
第二章:文献综述;本文首先论述基于关键词提取的文本挖掘研究现状,主要通过关键词提取方法与关键词选取指标方法两方面进行概述;其次,对资产定价模型相关研究进行概述;第三,对企业创新能力与股票收益研究进行概述,主要从企业创新能力的度量与创新能力与股票收益的关系研究、文本分析法在股票收益应用方面进行概述。最后,对上述文献部分进行文献总结与述评。
第三章:理论基础;本章节主要介绍专利文本分析法、投资Q理论与基于TF-IDF的中文关键词提取技术三方面进行分别进行阐述。
第四章:基于企业专利文本信息的创新信息载荷指标构建与分析;首先通过对测度创新信息载荷的TF-IDF算法进行具体说明,然后选取我国信息行业上市公司2005-2020年的专利文本摘要内容,并对信息行业创新信息载荷与股票收益的关系进行案例说明,数据主要来源于Patsnap智慧芽专利数据库。同时,通过Citespace软件对信息行业上市公司进行专利主题演化网络分析与关键词时区突现分析,以预测专利热点与未来发展趋势,并从一定程度对企业掌握研发热点更有利于增收提供佐证。
第二章文献综述
2.1基于关键词提取的文本挖掘研究现状
随着网络上非结构化文本的数据增多,利用文本挖掘对语义相同或相似的文本进行去重并抽取关键词以凸显该文本内容的主题与核心,能够充分挖掘文本内容的有效信息并作用于目标的实现。在查阅国内外相关文献后,发现基于关键词提取的研究主要分为两大类:一是关键词抽取方法;二是关键词选取指标方法。
(1)关键词抽取方法
从目前的研究来看,对于关键词抽取方法,研究者主要将其分为有监督方法与无监督方法。有监督方法是指预先建立一个带标签数据集的训练库,借助分类算法判断候选词是否为关键词。尽管有监督方法可以有效地提高关键词抽取的准确率,但由于需要不断注入大量的标签数据,而语料集难以穷尽,这种方法受到了一定制约。相比之下,无监督方法通过计算候选词与整个语料库之间的相似度,以及候选词在整个语料库的位置等信息来确认是否为关键词,尽管存在一定误差率,但具有良好的可拓展性与实用性,可以大大提高专利文本的处理效率和准确性。因此,在未来的关键词抽取研究中,无监督方法将继续得到广泛应用和推广。其主要分为基于统计的方法、基于图的方法和基于文本聚类的方法。
基于统计的关键词抽取方法是指根据词语在文本中的词频、词权重、词语间的关联程度来判断词语是否能够作为文本关键词的方法,主要分为词频分析法、共词分析法。词频分析法通过计算文本中的每个词出现频率来分析文本,在研究热点与进行热点迁移与前沿分析方面具有广泛应用。高劲松(2010)[4]运用词频的绝对值对国际专利信息领域的文献进行高频词统计,得出该领域专利研究的热点。奉国和(2020)[5]在统计词频时引入了时间因素加权,认为越新的词语对研究热点的贡献越大,时间权重越大,越能代表文档的特征。余丰民(2020)[6]基于关键词词频统计对学科研究热点进行分析,发现关键词词频不仅能够揭示研究的热点,也能揭示热点研究的变化与漂移程度,即探究热点的生存周期与存在规律性。
2.2资产定价模型相关研究
20世纪60年代,Sharpe[19]基于投资组合理论首次提出CAPM模型,以线性方程的形式说明了投资组合期望收益与期望风险之间的关系,开启了资产定价理论与实证研究的发展。Fama和French(1993)[20]发现除了系统性风险会影响股票收益以外,公司的基本面也会对股票收益率产生影响,基于此将市场风险、规模效应与账面市值比作为风险定价因子建立三因子资产定价模型,通过实证检验发现解释力度要强于CAPM模型,Fama-French三因子模型在资产定价理论发展中运用广泛,国内外学者利用该模型检验了在不同地区不同行业的适用状况。如张宏亮(2014)[21]通过实证证明Fama-French三因子模型能够完全解释我国资本市场的股票预期收益率,具有一定的适用性。Qingsong Ruan(2017)[22]选取1926年至2015年美国特定五个行业,发现三因子模型在很大程度上可以解释各行业的收益情况,其中市场风险溢价因子与投资组合收益的相关性最强。
后期随着资本市场的不断发展与金融市场环境的不断变化,学者在三因子模型的基础上进行了不断改进。Carhart(1997)[23]在Fama-French三因子模型中增加动量因素,使其成为四因子模型。Fama和French(2015)[24]加入盈利因子和投资因子构建五因子模型,发现相比三因子模型,五因子的解释能力增强。齐岳(2020)[25]认为公司的治理水平会影响股票的收益率,并将其作为溢价因子纳入三因子模型中,结果发现,由于公司治理因子的加入,股票组合收益率的解释力度增强。燕群(2021)[26]认为互联网技术的发展会影响企业的经营发展进而影响企业的资本资产价值,通过测度互联网技术渗透度因子,在Fama-French三因子模型上构建四因子模型,发现在高账面市值比的零售业企业,四因子模型拟合程度更强。欧阳红兵(2020)[27]认为特质下行风险会影响个股预期收益,创新地将特质下行风险因子引入Fama-French五因子模型中,提高了五因子模型的定价效率。
第三章理论基础..........................12
3.1专利文本分析法............................12
3.2 Q理论................................12
第四章基于企业专利文本信息的创新指标构建与分析........................14
4.1样本选取及数据来源...................................14
4.2创新信息载荷指标构建..................................14
第五章创新信息载荷与公司股票收益关系.................25
5.1研究假设及模型设定............................................25
5.2样本数据及描述性统计....................................26
六章基于创新信息因子的资产定价分析
6.1创新信息因子作为风险因子的检验
6.1.1研究假设
具有高创新能力的企业往往追求获得更高的资产利润率,进而得到更高水平的盈利收入。[47](Hirshleifer,2013)这是因为研发投入是否能够带来创新成果与创新成果是否能够转化为创新资产往往具有时滞性与不确定性,考虑到与创新资产的未来回报相关的风险与不确定性,导致企业对创新资产未来预期回报更高,进而提高盈利水平。换句话说,公司从创新资产中获得的高回报补偿了当时投资于创新的高风险。因此,企业创新能力可以作为风险的衡量,创新能力越高的企业会通过获得高风险补偿进而获得更高水平的盈利能力。
6.1.2模型构建
自20世纪60年代Sharpe(1964)[82]等在投资组合理论的基础上提出CAPM模型以来,有关资产定价的理论循序发展。Fama和French(1993)[20]在传统资产定价模型的基础上,考虑到市场风险、规模效应和账面市值比的影响构建三因子资产定价模型,后又在此基础上考虑盈利和投资因素的影响构建五因子模型,发现模型的解释能力得到有效提高[48]。因此,本文分别使用三因子模型和五因子模型检验创新信息因子是否能够作为风险因子对股票收益产生影响。首先,对于创新信息因子的构建参考李方艳(2022)[83]的做法以四种方式分别构建创新信息因子:
(1)按照TF-IDF算法加权计算出的创新信息载荷权重,将股票进行五等分划分,然后通过买入(做多)权重较高的20%的股票组合,卖出(做空)20%权重较低的股票组合构建创新信息因子(TQ20-20)。
(2)按照TF-IDF算法加权计算出的创新信息载荷权重,将股票分为权重最高组占30%,中间组占40%,最低组占30%;然后通过买入(做多)权重最高组30%的股票组合,卖出(做空)30%权重最低组股票组合构建创新信息因子(TQ30-30)。
(3)按照TF-IDF算法加权计算出的创新信息载荷权重,将股票分为权重最高组占40%,中间组占20%,最低组占40%;然后通过买入(做多)权重最高组40%的股票组合,卖出(做空)40%权重最低组股票组合构建创新信息因子(TQ40-40)。
(4)按照TF-IDF算法加权计算出的创新信息载荷权重,将股票分为权重最高组占50%,最低组占50%;然后通过买入(做多)权重最高组50%的股票组合,卖出(做空)50%权重最低组股票组合构建创新信息因子(TQ50-50)。
第七章结论
7.1结论
创新驱动高质量经济发展是我国实现经济转型的重要战略举措,也是面对国际核心技术竞争最强大的武器。通常来说,创新竞争最激烈、产出成果最多大都集中在高科技领域,因此以信息行业作为推动数字化转型和智能化发展,进而实现各行各业数字化升级和智能化改造的先行军,从微观角度洞悉我国信息行业企业的创新水平是推动信息时代发展和进步的必由之路。特别地,随着我国资本市场不断发展,知识产权保护得到重视,企业利用申请专利来获得保护的意识增强,在这样的背景下,探讨企业创新信息载荷水平能否反映在股票市场上具有现实意义。
首先,本文基于TF-IDF算法加权来测量创新信息载荷,再通过LSI算法进行主题聚类,将专利关键词划分在18个主题聚类上并进行演化图展示。从专利关键词词频演化角度来看,信息行业研究热点的出现、发展和消亡遵循科学研究的循环形态,且专利信息的研究热点呈现比较明显的集中趋势:如何提高系统及模块的精度与效率一直是研究的前沿,而运用深度学习、神经网络等人工智能算法进行创造是近期热点所在。从突现图来看,我国信息行业专利成果在不同时期存在差异,专利成果随着时代的发展与市场需求变化而变化。同时,通过对专利申请量最多的前100家的公司专利进行文本聚类构建旭日图,发现与本文基于TF-IDF算法聚类所得基本吻合,进一步证实了本文专利关键词挖掘的可靠性。
其次,本文探讨了创新信息载荷对股票收益的影响。首先通过回归分析检验创新信息载荷对股票收益的影响,结果发现创新信息载荷对股票收益存在显著正向影响,在加入控制变量后的回归拟合程度也有所提高,通过投资组合分析也得出相同结论,这说明创新信息载荷越高的企业,股票回报越高,通过创新信息载荷进行买多做空的投资组合能够赚取额外的超额收益。
最后,本文主要分为两大方面:一方面,基于投资Q理论探讨创新信息载荷-股票收益效应是否来源于风险因子。实证通过创新信息载荷构建四种创新信息因子并代入Fama-French三因子或五因子模型中,发现创新信息因子系数在5%的水平下显著为正,是一个风险因子并有效作用于模型中;其次,将创新信息因子与其他因子进行相关性因子与回归分析发现,创新信息因子不是一个冗杂因子,能够解释市场风险溢价因子以外的风险溢价,再次证明创新信息因子是会对股票收益定价产生影响的风险因子。
参考文献(略)
相关文章
UKthesis provides an online writing service for all types of academic writing. Check out some of them and don't hesitate to place your order.