本文是一篇物流论文,本文分析司机找货路线的时序变化发现,司机找货行为具有明显的时刻特征,一天内的不同时段对司机的路线选择具有显著影响,用户在不同时段上存在不同的偏好,司机在上午的找货路线更多更复杂,下午次之,夜间的复杂度最低。而在一周内的每一天基本是稳定的。
第1章 绪论
1.1 研究背景及意义
1.1.1 司机寻货推荐的背景和意义
随着我国经济的不断发展,贸易量逐年上升,物流运输的重要性愈加突出。其中,公路运输是我国货运的主要运输方式,根据国家统计局数据显示,2020年我国货运总量为463.47亿吨,其中,公路货运量为342.6亿吨,占比约为74%。根据有关数据显示,我国约有3000多万名货车司机从事公路运输行业,近年来,他们承运了全国70%以上的货物,是我国物流运输行业的主力军。相较于其他发达国家而言,我国的公路货运运力结构比较特殊,个体散户司机比率超90%,区域运力分散化,碎片化程度极高。
随着移动互联网和人工智能技术的应用,公路货运平台应运而生。现我国76.5%的司机都已入驻以满帮、云鸟配送、货拉拉等为代表的在线货运交易平台。尽管公路货运交易平台集合了数百万的货车用户,但仍旧是独立的个体司机,平台尚不具备全面实施车货匹配的调度能力。司机寻找货源的方式仍然是以搜索为主,以国内知名车货匹配平台“运满满”app为例,活跃用户中100%的司机会使用“搜索”,截取运满满司机端app的主页如图1-1所示,主要业务在“配货大厅”和“当天货源”中,“配货大厅”记录的是司机自己订阅的路线,而“当天货源”为搜索筛选界面。
由于司机运输不受平台管辖,因此平台业务中更多的还是由货车司机和货主分别提供运力信息和货单信息在线自由交易。平台的主要业务或者是由司机自发检索合适的货物或者是将一些新发货源通过横幅、播报的方式通知司机。从图1-1可以看出现行的车货匹配平台的业务主要还是以司机自行检索,即车找货为主,尽管国内车货匹配做了比较丰富的研究,但实际匹配效率并不高,仅使用实际运单数据难以观察到司机的偏好变化过程。司机自发检索存在效率低下的问题,平台为司机提供了越来越多的货物信息选择,反而较低了对这些海量信息的利用率,货物信息过载现象越来越严峻,司机在平台搜货的过程中消耗的时间成本成倍增加;平台推送存在策略精准问题,现有的推荐算法效益并不高,如果推送货源不符合司机需求,不仅容易导致用户投诉,同时可能丢失一些忠实用户。
1.2 国内外研究现状
为了实现基于在线交易平台的司机寻货路线推荐,挖掘司机个体出行特征、了解线上交易推荐模式和推荐模型以及明确该问题的研究现状是其中的关键内容。
1.2.1 出行特征挖掘
目前,研究学者们已经利用移动轨迹数据、智能公交数据等对人类个体、普通车辆等进行了丰富的移动特征的探索。
利用移动轨迹数据分析乘客的出行特征在各领域都得到了广泛关注[7-11]。传统居民出行特征的出行需求收益调查,通常以日间乘客的交通调查为基础,挖掘“静态”居民出行需求特征。Wen Li等人(2020)分析了居民出行特征和偏好,探讨了社会经济属性、出行特征、偏好的主要影响因素[12]。Cai Xiaoyu等人(2021)基于历史RFID轨迹数据,对私家车和出租车的轨迹数据进行挖掘,从出行频率、上线时间、轨迹重复率、出行周期、活动偏好区域和主线影响区域偏好对私家车和出租车中存在的特征群体进行识别和分类[13]。与此同时,研究发现无论在时间上还是在空间上,城市出行行为都在发生变化[14-16]。因此,识别城市出行行为至关重要,尤其是描述这种动态行为[17]。Xu H J等人(2019)融合了城市居民出行方式和居民出行选择行为动态预测居民的出行需求[18]。Xia D等人(2021)利用出租车轨迹数据分析乘客的出行时长和出行距离,提出了一种并行聚类方法挖掘乘客出行的时空特征,从而获得居民出行在一天中不同时段的特征变化[19]。
第2章 数据处理与基本分析
2.1 数据介绍与预处理
2.1.1 数据介绍
本文使用的数据源是司机在线上货运交易平台的搜索、点击、成交数据,搜索和点击被看作是司机成交前的准备,而成交则是司机实际的交易数据。为保证平台信息不轻易泄露,文中将对司机ID等信息进行隐藏。选取了2021年4月26日-2021年5月16日在平台产生了交易订单的部分司机的行为数据,其中,这部分司机在5月21日-5月26日均有线上行为,总共选取了812名司机。
样本数据记录了司机在平台上产生的行为,搜索、点击和成交都是由司机自发产生,因此各个司机的数据条数不一。数据字段和示例如表2-1、表2-2、表2-3所示,数据字段包括:user_id, create_time, action, start_city_name, end_city_name, loc_city。
2.2司机线上行为分布特征
司机线上行为数据包括搜索、点击和成交,其中,路线成交数据是司机实际交易的行为,称为交易数据;路线搜索和点击数据属于司机找货的过程,称为找货数据。本研究中将使用大量的司机找货数据预测司机可能成交的路线,因此首先需要论证司机的找货数据是否足以分析司机的交易概率。所以,本节将对比司机交易数据和找货数据的时空分布情况,观察找货数据的有效性。
2.2.1 司机线上寻货时间分布特征
根据成交单数分析司机的交易时间分布,确定交易密集时间;根据找货频次分析司机的找货时间分布,确定找货密集时间;并观察司机寻货路线的时间分布形态。如图2-3所示,蓝色表示司机每小时的成交单数分布,橙色表示司机每小时的找货记录分布,明显看出,司机的交易时间分布和找货时间分布基本统一,司机的找货特征反映了接单特征。
从成交单数的角度分析,司机的成交密集时间主要分布在上午8-11时,其中,8时和9时的成交单最多,第二个波峰值出现在下午2时。从找货频次的角度分析,司机的密集找货时间同样在上午8-11时,8时和9时出现第一个波峰,第二个波峰出现在下午3时出现。夜间的成交量和搜货量都非常低,大约是22时至第二日5时内,司机的线上行为较少。总体来看,上午7-9时司机的线上行为急剧增多,与此同时,10-13时又有急剧减少的表现,14-17时是下午时段的活跃高峰,推测上午7-9时和下午14-17时是货物装卸的高峰时期。从时间分布形态来看,司机的找货密集时刻也正是成交密集时刻,找货分布趋势变化与成交分布趋势变化基本一致,说明司机线上找货效果好,时间具备同步性。
第3章 司机寻货路线特征挖掘 ........................... 24
3.1 线上寻货路线的时间分布特征 ............................. 24
3.2 线上寻货路线的地理分布特征 .................................... 26
第4章 基于区域潜在路线挖掘的推荐算法 ............................. 38
4.1 区域潜在路线挖掘 .................................. 38
4.2 有效性分析 ...................................... 41
第5章 基于在线货运平台的推荐模型及实证分析 ............................ 47
5.1 问题定义 ........................................ 47
5.2 模型描述 ..................................... 48
第5章 基于在线货运平台的推荐模型及实证分析
5.1 问题定义
本章将解决的问题是:利用司机既有行为中的路线偏好,根据司机青睐路线发生变化的条件,挖掘不同场景下的司机青睐路线特征,离线推荐司机青睐路线集合并按照可能成交概率降序排序。因此,本章构建的模型架构如图5-1所示,分为三个模块,分别是输入层、推荐层和输出部分。其中,输入层除了已有的6个字段以及还包括出发地和目的地的地理标签,判断是否为司机路线搜索中的热点区域等。推荐层逻辑是:将输入的数据从时间变化和位置变化切分转化形成新的可用于模型训练的数据及特征,优化评分矩阵内容。而后从全部可能的路线中确定对于目标司机而言可能推荐的全部路线即为全部召回,再根据相似用户和目标用户对每条路线的交互权重设计生成推荐概率,取其中可能成交率大于30%的路线降序排序,得到TOP-N条路线生成推荐结果。而这个推荐结果一般是以列表的形式呈现。
总结与展望
(一)结论
本文基于司机在线货运交易数据,包括找货行为数据和交易数据,首先对其进行一定的处理,然后对比分析了司机的找货行为与交易行为,挖掘了司机的找货时间特征、地理特征和定位地特征并对司机的行为模式进行了区分,在此基础上基于Voronoi算法挖掘了司机可能选择的潜在路线并分析了其算法有效性,最后从时空策略方面构建了司机找货路线推荐模型,取得了稳定的效果,为实现高效的车货匹配奠定了基础。主要获得的结论有如下几点:
(1)货车司机选择路线的找货行为特征与交易行为特征一致,从时间分布形态来看,司机的找货密集时刻也正是成交密集时刻,找货分布趋势变化与成交分布趋势变化基本一致,时间具备同步性。并且发现司机要想成交一单,需要自主搜索约667单在线货源,大约需要两天时间。从空间分布来看,司机的找货距离特征基本反应了司机的实际接货距离特征,与交易特征存在一致性。分析发现司机的寻货半径大概在400km以内,且更偏向于中短途运输。主动搜索与实际承运之间的容忍在50km-60km,司机实际承运时会更加放宽订单选择条件。充分证明研究司机线上寻货路线的偏好,并实现司机青睐路线的预测和推荐是合理且有意义的。
(2)分析司机找货路线的时序变化发现,司机找货行为具有明显的时刻特征,一天内的不同时段对司机的路线选择具有显著影响,用户在不同时段上存在不同的偏好,司机在上午的找货路线更多更复杂,下午次之,夜间的复杂度最低。而在一周内的每一天基本是稳定的。
(3)分析司机找货路线的地理分布发现,司机找货行为具有明显的地理特征,地理因素对司机的路线选择具有显著影响。通过对城市进行地理位置划分可将司机的找货路线行为归纳为三类,分别是“干线型”模式、“轴辐式”模式和“环型”模式,其中,“干线型”模式占比最高。融合地理区域的近邻性有助于挖掘司机潜在偏好路线,提高路线推荐的精度。
参考文献(略)
相关文章
UKthesis provides an online writing service for all types of academic writing. Check out some of them and don't hesitate to place your order.