基于Pearson相关系数对蔬菜各品类及单品销售量分布规律及相互关系的研究

(整期优先)网络出版时间:2023-11-08
/ 2

基于Pearson相关系数对蔬菜各品类及单品销售量分布规律及相互关系的研究

王聚祥,周迎春,于梦晗  指导教师:李董潞

山东协和学院工学院,山东 济南 250109

摘要:在生鲜商超内销售的蔬菜类产品,由于其保鲜期太短,必须在短期内售出,以保证商超收益。通过研究蔬菜各品类及单品销售量分布规律及相互关系帮助商超制定蔬菜的补货和定价决策,对于保证商超收益具有重要意义。用3年的销售流水的数据,计算单品平均销售量、标准差、中位数等,来进行单品和品类的销售量描述性统计。然后通过计算蔬菜单品在各季度的销售总量,画出折线图,分析各单品在不同季度的销售分布规律。计算品类在各月份的销量和各季度的销量并画出折线图,分析得出各品类的畅销月份、各品类每月的变化趋势情况以及年度的周期性3大规律。通过Shapiro-Wilk检验来检验各个品类每季度的销售量数据是否符合正态分布,用Pearson相关系数描述相互关系,计算不同品类及单品之间的相关性。

关键词描述性统计  Shapiro-Wilk检验  Pearson相关系数

一、问题重述

1.问题的数据条件

本题提供四个附件,材料1给出蔬菜品类和单品的名称及编码,材料2、3分别给出了商超一段时间内商品的销售明细及批发价格信息,材料4提供各商品近期损耗率。

3.问题的提出

蔬菜类商品中,不同的品类或独立的单品之间可能会相互影响销售,研究蔬菜销售的各品类和单品之间的销售量分布规律以及它们之间的关联关系。

二、问题分析

问题一实际包含两个小问,分别是:分析蔬菜各品类及单品销售量的分布规律[1]和蔬菜各品类及单品销售量的相互关系。

1.对于各品类及单品销售量的分布规律

在数据处理中首先应该考虑数据的预处理,数据预处理通常包括:缺失值处理、异常值数据处理、重复数据处理、数据标准化等。经过对附件中给出数据的分析,附件中的数据时间较为完整且不存在异常值与重复数据,故本文不对数据进行过度清洗。

首先将附件一中的单品名称及分类名称整合到附件二,便于后期的计算。通过3年的销售流水的数据,使用平均销售量、标准差、中位数等作为统计量,来进行单品和品类的销售量描述性统计。计算蔬菜单品在各季度的销售总量,画出折线图,分析各单品在不同季度的销售分布规律。通过计算品类在各月份的销量和各季度的销量画出折线图,分析得出各品类的销售量分布规律[2]

2.对于各品类及单品销售量的相互关系

首先用Shapiro-Wilk检验来检验各个品类每季度的销售量数据是否符合正态分布,通过计算出的销售量和平均值,使用Pearson相关系数[3]分别计算蔬菜品类及单品的相关系数,分析各自的相关性。

三、模型的建立与求解

3.1销售量的描述性统计

首先本文利用销售量的平均值、标准差、中位数、销售次数、销售总量5项统计量作为指标,分析销售量的分布特征。

1.平均销售量:

(1.)

其中,为单品n再第j次的销售量,是总的销售次数。

2.单品n销售总量的标准差:

(2.)

3.销售量的中位数:

(3.)

利用SPSS分别计算三年销售流水中各单品和品类的各统计指标,发现鲜粽叶(袋)(1)的销售量平均值最大为4.87805kg,芜湖青椒(1)的销售总量是最大的,最大为28164.331kg。说明鲜粽叶(袋)(1)的销售情况比较集中,芜湖青椒(1)更受人们的喜爱。

根据各品类销售量分布情况可得,水生根茎类的平均销售量最大为0.69196kg,花叶类的销售量最大为198520.978 kg, 花菜类标准差最低为的为0.200746, 即水生根茎类蔬菜的销售量比较集中,花叶类蔬菜更受人们的欢迎,花菜类的销售量最稳定。

3.2蔬菜各品类及单品销售量的分布规律

1.蔬菜各单品销售量的分布规律

根据附件2中给出的3年销售流水,计算出蔬菜单品在各季度的销售总量,画出各季度蔬菜单品销售总量的分布折线图,根据折线图可以得到蔬菜各品类销售量的分布规律:不同单品之间的热销情况根据季度差异较大,其中云南生菜、小白菜、上海青等的销售量在第三季度最多,牛首生菜、苋菜、竹叶菜等的销售量在第二季度最多。

2.蔬菜各品类销售量的分布规律

通过EXCEL分别计算各个品类在各月份的总销售量和各个品类在每年各季度的总销售量,分别画出各月份不同品类总销量的分布折线图和每年各季度不同品类的总销售量分布的折线图。

综上所述,可以得到蔬菜各品类销售量的分布规律:

规律1:花菜类和花叶类的畅销时间出现在8月份,茄类的畅销时间出现在7月份,辣椒、食用菌和水生根茎类的畅销时间出现在1月份。

规律2:1-6月各品类的销售量呈现下降趋势,6-8月各品类的总销售量增加,8-9月又呈下降趋势,9-10月变化较平稳,10-12月又呈下降趋势。

规律3:各蔬菜品类在每年的总销售量呈现出周期性,并且每年各月份销售量的变化趋势基本相同。

3.3蔬菜各品类及单品销售量的相互关系

1.正态分布检验

首先检验各个品类的蔬菜每季度的销售量数据是否符合正态分布。对数据进行Shapiro-Wilk检验,经计算得出,六个品类销量不呈现显著性(当p值小于0.05或0.01时呈现显著性),且峰度绝对值都小于10,偏度绝对值小于3,说明符合正态分布,可用Pearson相关系数描述各个品类的关联关系。

2.蔬菜各单品销售量的相互关系

单品n和单品m之间的相关系数:

(4.)

通过相关系数,可以得到各单品之间的相关关系(篇幅原因这里不做展示)。

3.蔬菜各品类销售量的相互关系

通过相关系数,计算得到各品类之间相关关系,通过相关系数,得出结论:花叶类和花菜类高度正相关,食用菌类与水根茎类高度正相关,既是说明花叶类蔬菜和花菜类蔬菜的上升趋势几乎是一致的,食用菌类与水根茎类的上升趋势也几乎是一致的。

参考文献

[1]黄静.蔬菜经营企业的营销策略研究[D].贵州大学,2008.

[2]刘茹,王安妮,申旭慧等.新零售时代实体商超运营模式研究[J].中国商论,2018(05):1-2.DOI:10.19699/j.cnki.issn2096-0298.2018.05.001.

[3]余红梅,罗艳虹,萨建等.组内相关系数及其软件实现[J].中国卫生统计,2011,28(05):497-500.


 论文来源:2023年“高教社杯”全国大学生数学建模竞赛