基于GM(1,1)-BP神经网络的天津港物流需求预测模型研究

(整期优先)网络出版时间:2021-11-18
/ 6

基于 GM(1,1)-BP神经网络的天津港物流需求预测模型研究

刘子毅

华北电力大学 经济与管理学院 102206

摘要:港口是沿海城市结构的重要部分,港口物流需求对沿海城市的经济发展具有支撑作用,而受疫情影响港口物流需求具有不确定性,对港口物流的需求进行预测分析提出精度更高的预测思路是港口城市亟需解决的问题。文章基于天津港货物吞吐量的历史数据构建了GM(1,1)模型和BP神经网络模型,再通过单一模型的均方误差求得组合模型的权系数,采用加权系数法将两种模型结合得到灰色模型与神经网络的组合模型。通过比较,组合预测模型比单一预测模型的预测效果更加精确,这为疫情下天津港的规划发展和物流决策提供依据。

关键词:GM(1,1)模型;BP神经网络;物流需求;组合预测;港口

Logistics demand forecasting model of Tianjin Port Based on GM (1,1) - BP neural network

Liu Ziyi

(school of economics and management, north China electric power university,102206)


Abstract: Port is an important part of the structure of coastal cities. Port logistics demand plays a supporting role in the economic development of coastal cities, but affected by the epidemic situation, the demand of port logistics is uncertain. It is an urgent problem for port cities to forecast and analyze the demand of port logistics and put forward more accurate prediction ideas. The first mock exam is based on the historical data of Tianjin port cargo throughput. GM (1,1) model and BP neural network model are constructed. Then the weight coefficients of the combined model are obtained through the mean square error of a single model. The two models are combined by the weighted coefficient method to get the combined model of grey model and neural network. By comparison, the combined forecasting model is more accurate than the single prediction model, which provides the basis for the planning and development of Tianjin port and logistics decision-making under the epidemic situation.

Key words: GM (1,1) model; BP neural network; logistics demand; combined forecasting; port

1.引言

在经济全球化的大背景下,港口为各国之间的贸易往来提供了契机,港口作为物流的节点对推动全球贸易往来起到重要的作用。随着京津冀协同发展战略的实施,天津港的发展对于天津市成为我国北方国际航运核心区的建设发挥着极为重要的作用。由于天津港地处环渤海及京津冀经济圈,腹地深厚,以首都为核心的世界级城市群具有广阔的市场和良好的区位优势,故对天津港的物流需求进行精准的预测,将为港口物流产业健康可持续发展以及物流基础设施规划设计提供可靠的数据支持。

目前有很多学者对GM(1,1)模型和BP神经网络应用到物流需求预测上做了大量的研究。王再明、王宏波(2005)[1]以灰色系统理论为基础,通过建立GM(1,1)和及其残差修正的模型对武汉港口的吞吐量进行了中短期的预测,并对集装箱吞吐量的预测结果进行残差检验和残差修正。张世良、黄跃华(2014)[2]采用GM(1,1)扩展模型对天津港进出船舶数量进行了预测。李洪磊,王德闯(2016)

[3]基于灰色系统理论对大连港的物流需求进行研究,并根据历史数据预测了大连港未来五年的物流需求。GM(1,1)作为时间序列预测法的一种,其仅将时间作为影响预测目标的因素,没有考虑到其他实际存在的影响预测目标的因素,在有效揭示各影响因素之间的关系上存在局限性。刘枚莲、朱美华(2012)[4]将外贸进出口总量、第一产业总值和第三产业总值作为BP网络模型的输入变量,港口吞吐量作为BP网络模型的输出变量建立BP神经网络预测模型,基于此模型对广西西部湾港口需求量进行了预测。高秀春(2014)[5]等以BP网络模型理论为基础,建立科学、可操作性的港口物流需求预测模型,并用于曹妃甸港吞吐量的预测工作中,最终提出曹妃甸港未来发展现代物流的政策建议。魏辉(2019)[6]通过对港口物流需求相关影响因素的分析建立预测的指标体系,利用BP神经网络算法建立港口物流需求预测模型,并以大连港为例验证模型的精度。利用BP神经管网络算法能够有效处理各影响因素与预测目标之间非线性的关系。但是,人工智能算法仍存在一定缺陷,第一,模型无法直观地呈现出各影响因素对预测目标的影响程度;第二,模型的泛化能力不能得到较好的保证,致使预测结果不稳定。为此,组合模型被越来越多地应用于港口物流预测。柳艳姣、肖青(2006)[7]分别采用了时间序列的三次指数平滑法、改进的GM(1,1)残差模型以及组合预测方法对集装箱吞吐量进行了研究,并对未来几年的吞吐量进行了预测,结果证明组合预测模型在方法上可进行优势互补,有效提升了预测精度。万福来(2012)[8]将灰色理论与神经网络算法相结合来克服数据贫乏和数据非线性的困难,分析了影响港口物流需求的因素,并对天津港物流需求进行了预测。余建华(2017)[9]将灰色预测理论与神经网络模型结合起来,分别使用神经网络和灰色预测以及组合模型对煤矿的能耗进行预测研究,发现组合模型能够有效地降低预测误差,提高预测精度。蔡婉贞(2019)[10]等提出一种基于BP-RBF神经网络的组合预测模型,依据各子模型预测结果赋予不同权重进一步构建加权组合预测模型,再以汕头港为例进行仿真预测,提高了预测精度。综上所述,灰色预测模型具有计算简单、所需样本数据少等优点;BP神经网络具有高度的非线性,同时还具有学习和记忆能力,泛化能力强等优势。故本文将灰色模型和反向传播神经网络组合在一起,既可弥补灰色预测不能对繁杂非线性函数进行求解的缺点,又能发挥二者的优势,以便于进一步呈现输入输出的变化趋势。另外,本文针对不同模型对预测结果的贡献度来施加适当的权重,增加了组合模型的预测精度。

2.基本理论

2.1灰色预测GM(1,1)模型

灰色理论是邓聚龙教授于1982年提出的一种用于处理既含有已知信息又含有未知或非确定信息问题的方法。灰色模型(grey models)就是通过少量的、不完全的信息,建立灰色微分预测模型,来更好地对系统内部特征和发展趋势进行描述[13]。而GM(1,1)模型是灰色理论建模中最典型及应用范围最广的模型之一,即包含1个变量的1阶灰色白化微分方程,根据灰色系统内已知信息,对原始序列按微分方程拟合逼近序列所呈现的动态趋势,以此来预测未来发展趋势。其建模过程如下:

首先将数据进行排序形成数列6195f57827f17_html_ea083a6a0c5156af.gif ,设6195f57827f17_html_6b2004b5d8563366.gif 为原始数据。对数列做一次累加生成新的数列6195f57827f17_html_a4c7532bc925eef1.gif6195f57827f17_html_de7bac446689287e.gif

根据新的数列建立一阶微分方程:

6195f57827f17_html_756ff973454f6993.gif (1)

式中,6195f57827f17_html_3a0bdfb493653ece.gif 为发展灰数,6195f57827f17_html_c9d9bdfdfb1966a7.gif 为内生控制灰数,6195f57827f17_html_65e723d5093f8533.gif 为时间,系数向量6195f57827f17_html_f9bc447ee922279e.gif 通过最小二乘法求得:6195f57827f17_html_fde48d550b16e3d.gif 其中:

6195f57827f17_html_6af699572f6222bc.gif (2)

6195f57827f17_html_2057b08e157341d7.gif

此模型即称为GM(1,1),其解就表示预测数据:

6195f57827f17_html_401089eb7edcbb8b.gif (3)

2.2 BP神经网络

BP(Back Propagation)神经网络由输入层、输出层及隐含层构成,是一种按误差逆向传播算法训练的前向网络,通过调整各层的权值和阈值来使得网络输出结果逼近目标函数结果,以此来获得输出数据与输入数据之间的数学模型,实现从输入到输出的任意非线性映射[20]。其学习过程分为两个阶段:正向传播阶段,即从输入层开始依次计算各层各节点的实际输入、输出;反向传播阶段,即根据实际输出与期望输出的误差,沿路反向修正各连接权值,使误差减少。上述两个阶段循环进行,不断调整各层的权值和阈值,当网络误差最小时,学习过程结束。

多层前馈数学模型为:


6195f57827f17_html_9708ee60ac0c56d9.gif


式中:6195f57827f17_html_15307f9a72df3a4.gif 为第I层第6195f57827f17_html_b69415042de92fc5.gif 个节点的输出值;6195f57827f17_html_3e8b244116bda5ce.gif 为第I层第6195f57827f17_html_b69415042de92fc5.gif 个节点的激活值;6195f57827f17_html_2651d3b5c19dddbc.gif 为第I-1层第6195f57827f17_html_77f4f50cbdcc9225.gif 个节点到第I层第6195f57827f17_html_b69415042de92fc5.gif 个节点的连接权值;6195f57827f17_html_169be6664d01da78.gif 为第I层第6195f57827f17_html_b69415042de92fc5.gif 个节点的阀值;6195f57827f17_html_7b7ad76a0ca7bb4.gif 为第I层节点数;L为总层数;6195f57827f17_html_643c9b862baac2c3.gif 为神经元激活函数。

反向传播表达式:

6195f57827f17_html_2af650f516c17ef6.gif6195f57827f17_html_ba38c7c0a75b80c3.gif 为学习率) (5)

2.3组合模型

考虑到港口物流需求预测是一个十分复杂的非线性问题,任何单个模型都难以全面地反映变量的变化规律。故将单一的预测模型以适当的方法进行有机组合、做到优势互补,就能科学地利用多种有效信息,更为全面地反映系统的变化规律,降低随机性,得到比单一模型更高的预测精度

[24]。由于神经网络的处理过程接近人类的思维活动,具有高速的并行计算能力,因此本文选择BP神经网络的方法和灰色预测模型进行结合,并根据均方误差来确定不同模型所被赋予的权重,从而形成灰色神经网络组合模型。设两种预测模型的均方误差分别为6195f57827f17_html_5d78f206a54f704.gif6195f57827f17_html_d35c7b4abd5ad4c4.gif ,6195f57827f17_html_2aeb71c79ce7b0fc.gif 求解公式为:

6195f57827f17_html_758a7d0a35874e19.gif

其中6195f57827f17_html_ae75e85cc2c479f2.gif 为实际值、6195f57827f17_html_ae6c72ed668dc3a9.gif 为预测值。则权系数分别为:6195f57827f17_html_3d6a8cf62ebc4222.gif6195f57827f17_html_763ab9c12bbdff35.gif =1-6195f57827f17_html_74bb1394f1f186c.gif ,假设预测值为6195f57827f17_html_8cfb21a9c0ad963e.gif6195f57827f17_html_39e377b7862576d1.gif ,得到组合模型的预测公式:6195f57827f17_html_1be92cfbe88088e9.gif 。组合模型预测流程图如图1所示:

6195f57827f17_html_c693d69dfdb185f0.gif

图1 算法流程图


  1. 确认该组合预测模型的输入数据,即将2000年到2019年共计20年的天津

港口货物吞吐量作为GM(1,1)预测模型的输入变量。

  1. 对GM(1,1)模型输出的预测结果数据进行归一化处理,计算输出均方误差。

(3)设置BP神经网络模型的相关参数、确定其网架结构,输入归一化的数据,利用BP神经网络得到预测值,并计算输出均方误差。

(4)由均方误差求得各子模型对应的权重,不同模型赋予不同的权重,建立组合预测模型得出最终的预测值。

3.天津港物流需求预测

3.1数据来源

仿真的数据来源于中国国家统计局,将天津港2000年到2019年共计20年的货物吞吐量的原始数据作为天津港物流需求的代表,将原始数据序列分为训练样本和测试样本两部分,训练样本为2000年到2012年的天津港口货物吞吐量数据,测试样本为2013年至2019年的数据,并利用测试样本对建立的模型进行检验。原始数据及趋势图如下:

年份

2000

2001

2002

2003

2004

2005

2006

吞吐量(万吨)

9566

11369

12906

16182

20619

24069

25760

年份

2007

2008

2009

2010

2011

2012

2013

吞吐量(万吨)

30946

35593

38111

41325

45338

47697

50063

年份

2014

2015

2016

2017

2018

2019


吞吐量(万吨)

54002

54051

55056

50056

50733

51021


表1:2000年到2019年天津港货物吞吐量数据

6195f57827f17_html_8c234224862bf9c8.gif

图2:2000年到2019年天津港货物吞吐量走势

3.2 GM(1,1)模型预测

本文使用MATLAB R2018a软件对样本数据做灰色模型预测求解,得到真实值与预测值的曲线如图3所示:

6195f57827f17_html_3ecacee28602179.png

图3:GM(1,1)模型拟合曲线

年份

2013

2014

2015

2016

吞吐量(万吨)

46954.50182


49452.74017

50595.64074

54519.13581

归一化

0.3916

0.48453

0.5271

0.6731

年份

2017

2018

2019


吞吐量(万吨)

58746.88267

59737.22644

63302.47484


归一化

0.8304

0.86731

1


表2:GM(1,1)模型的预测值及归一化

3.3 BP神经网络模型构建及预测

对BP神经网络预测模型进行设置,确认神经网络的激活函数和斜率,并把双极S型函数作为激活函数。然后确定BP神经网络的网架结构及相关参数,通过试验来确定神经网络的隐含层个数,先试验网络的第1层,假如仍未达到理想的预测效果就增加1层,直到达到理想的结果就停止增加。本文采用3层BP神经网络结构,隐含层的节点数量设为5,输出层节点数设为1。另外,在文章中将模型的全局最小误差定为0.005,训练最大次数为100次。为了将数据标准化并加快网络的运行速度,必须对数据进行归一化处理,归一化公式:

6195f57827f17_html_803e8b3c91081836.gif (7)

对样本输入进行归一化处理,使数据归一到[-1,1],其中,6195f57827f17_html_50b8d1f25ea315fa.gif 为原始样本数据序列,

6195f57827f17_html_e7cd5a7e9d22f7d5.gif6195f57827f17_html_1c5c3aaf5f15c369.gif 分别为样本的最大值和最小值。归一化后的原始数据为:

年份

2000

2001

2002

2003

2004

2005

2006

吞吐量(万吨)

-1

-0.9207

-0.8532

-0.7091

-0.514

-0.3624

-0.288

年份

2007

2008

2009

2010

2011

2012

2013

吞吐量(万吨)

0.06

0.1443

0.255

0.3963

0.5727

0.6765

0.7805

年份

2014

2015

2016

2017

2018

2019


吞吐量(万吨)

0.9537

0.9558

1

0.7802

0.5322

0.5429


表3:原始数据归一化处理

将归一化后的数据输入建立好的BP神经网络模型当中,即得到BP神经网络的预测结果如图4所示:

6195f57827f17_html_f8a06f68c23aaf64.png

图4:BP神经网络拟合曲线图

利用Matlab软件运行求解的过程中,系统会自动弹出此BP神经网络的学习情况并且以用图形展示出神经网络的具体结构如图5所示:

6195f57827f17_html_22c978e356414825.png

图5:BP神经网络训练过程示意图

点击图5的“Performance”,即可详细的看出此BP神经网络训练时所产生的误差性能曲线如图6所示。随着训练次数的不断增加,误差在逐渐减小,当训练次数达到70次时,误差降到最低。

6195f57827f17_html_b462b77cf2d8d48.png

图6:误差性能曲线

点击图5的“Regression”,系统显示出回归分析曲线如图7所示,更加直观的展示出了模型具有较高的拟合度。

6195f57827f17_html_e7c546307579347f.png

图7:回归分析曲线

3.4 GM(1,1)-BP神经网络组合模型预测

为了对2013至2019年的港口吞吐量预测更为精确,分别选取两个模型的均方误差以求得组合模型的权系数。经过计算,灰色GM(1,1)模型的6195f57827f17_html_5d78f206a54f704.gif = 0.079292243,BP神经网络算法的6195f57827f17_html_d35c7b4abd5ad4c4.gif = 0.005516894,所以,6195f57827f17_html_ea41a6908e6025d2.gif =0.07,6195f57827f17_html_763ab9c12bbdff35.gif =0.93,最后得到组合预测模型为:6195f57827f17_html_50b8d1f25ea315fa.gif =0.076195f57827f17_html_8cfb21a9c0ad963e.gif +0.936195f57827f17_html_39e377b7862576d1.gif 。故通过加权后的组合预测模型结果拟合曲线如图8:

6195f57827f17_html_73dfd06a37b98a59.png

图8:组合预测模型拟合曲线

组合模型的预测结果如表4,文章中均用归一化后的数据进行比较分析模型拟合的优劣。


年份


真实值

GM(1,1)模型

BP神经网络模型

加权组合模型

预测值

相对误差

预测值

相对误差

预测值

相对误差

2013

0.7805

0.3916

0.4983

0.7738

0.0428

0.7471

0.0085

2014

0.9537

0.4845

0.4919

0.8296

0.1523

0.8084

0.1301

2015

0.9558

0.5271

0.505

0.8712

0.103

0.8573

0.0885

2016

1

0.6731

0.3269

0.9021

0.1029

0.8971

0.0979

2017

0.7802

0.8304

0.0643

0.925

0.1924

0.9303

0.1856

2018

0.5322

0.8673

0.6297

0.9337

0.43

0.929

0.427

2019

0.5429

1

0.8419

0.9647

0.4372

0.9671

0.433

表4:组合模型预测结果

预测精度比较如表5所示,本文利用平均绝对百分误差(MAPE)作为衡量模型预测精度优劣的指标。从表5可以看出在三种预测模型当中,加权组合预测模型的平均绝对百分误差低于单一模型,说明了通过加权组合后的GM(1,1)-BP神经网络预测模型可以更好的提高预测精度。

模型

GM(1,1)

BP神经网络

组合模型

MAPE

5.94

1.85

1.65

表5:三种模型预测精度对比

由三种模型的拟合趋势图可以直观的看出进行权重分配后的组合预测模型比单项预测模型具有更好的拟合度。

6195f57827f17_html_940d160776b1b435.png

图9:三种模型的拟合趋势图

4.结论

本文分别建立了基于GM(1,1)模型和BP神经网络模型的预测模型以及上述两种模型通过加权结合的GM(1,1)-BP神经网络组合模型对天津港物流需求量进行拟合预测。通过相对误差和平均绝对百分误差的比较,得出结论:GM(1,1)模型和BP神经网络模型都可单独来对港口物流的需求量做出预测。单独使用灰色模型预测的结果仍有部分预测结果与实际值存在较大差异;单独使用BP-NN模型预测的结果整体拟合度较好,但是相比分配权重后的组合模型,其预测值与实际值的误差仍较大。因此在三种模型当中GM(1,1)-BP神经网络组合模型对于天津港口的物流需求预测精度最高,这种加权组合预测有效的减少了较大误差的出现,进一步说明了该预测方法对于天津港物流需求预测是可行的。另外,从拟合趋势图像可知天津港的物流需求量在逐年攀升,这对于天津港来讲既是机遇又是挑战,需要天津港结合自身独特的区位优势,加强与环渤海及京津冀经济圈的紧密联系,为天津港口物流发展营造出良好的环境。

参考文献:

[1]张世良,黄跃华.基于GM(1,1)扩展模型的天津港进出港船舶数量的预测研究[J].科技创新与应用,2014(08):26-27.

[2]王再明,王宏波.灰色系统理论在港口吞吐量预测中的应用[J].武汉理工大学学报(交通科学与工程版),2005(03):456-459.

[3]李洪磊,王德闯.基于灰色系统理论的大连港口物流需求预测[J].物流科技,2016,(1):17-20.

[4]刘枚莲,朱美华.基于BP神经网络的港口吞吐量预测模型[J].系统科学学报,2012,20(04):88-91.

[5]高秀春,等.基于BP模型的港口物流需求预测研究[J].物流技术,2014,2(33):99-101.

[6]魏辉.基于BP神经网络的港口物流需求预测[J].决策探索(中), 2019,(9):86-88.

[7]柳艳娇,肖青.组合模型在港口集装箱吞吐量预测中的应用[J].大连海事大学学报,2006(03):26-28.

[8]万福来. 天津港物流需求预测和物流发展策略研究[D].天津大学,2012.

[9]余建华.基于灰色神经网络组合模型的煤矿能耗预测研究[J].煤炭技术,2017,(9):333-335.

[10]蔡婉贞,黄瀚.基于BP-RBF神经网络的组合模型预测港口物流需求研究[J].郑州大学学报(工学版),2019,40(5):85-91.

[11]吴涵,等.港口物流需求趋势预测方法研究--基于组合预测模型对重庆港口物流需求趋势分析[J].价格理论与实践,2019,(9):75-78.

[12]何为惠.广州港物流发展需求预测研究[D].广州:华南理工大学,2014.

[13]郭维民.GM(1,1)与BP神经网络组合预测模型在田径成绩预测中的应用[J].体育研究与教育,2013,28(5):95-97.

[14]孟雪,等.基于灰色GM(1,1)和神经网络组合模型的基坑周边地面沉降预测分析[J].勘察科学技术,2018,(6):39-44.

[15]侯宝燕,基于组合预测法的营口港物流需求预测研究[D].大连:大连交通大学,2013.

[16]贾龙钰.泰州港物流需求预测研究[D].昆明:昆明理工大学,2019.

[17]陈洋.我国港口物流需求预测研究评述[J].合作经济与科技,2016,(8):43-

[18]闫娟.灰色神经网络模型在物流需求预测中的研究[J].计算机仿真,2011,(7):200-203.

[19]尚杰,杨其昭.基于灰色—指数平滑组合模型的我国绿色食品市场预测[J].环境与可持续发展,2015,(6):44-46.

[20]马辉,等.基于灰色-BP神经网络组合模型的水位预测案例[J].人民黄河,2016,(12):89-92.

[21]易怀军,等.基于组合灰色神经网络模型的火炮身管烧蚀磨损量预测[J].火炮发射与控制学报,2015,(3):81-85.

[22]钱叶霞.基于权重分配组合模型的考研国家线预测[J].科学技术创新,2018,(32):8-10.

[23]陈丹,朱萍.基于GM(1,1)模型的成都市物流需求预测分析[J].物流科技,2019,(10):131-133.

[24]朱方方,覃鹏,赵祖菊,王正.基于组合预测方法的公路客运量预测[J].综合运输,2017,39(02):52-61.



7