大数据与统计学的企业管理实战

(整期优先)网络出版时间:2022-07-21
/ 3

大数据与统计学的企业管理实战

冯首正

深圳市风正科技有限公司 深圳 龙岗  518112

摘要:传统商业经过互联网洗礼,电子化记录,无纸化办公已经渗透商业的方方面面,一度兴起的各类统计学ERP CRM信息系统,更是令许多经营者耳目一新。互联网的到来,不单单通过电子商务,为企业提供了新的供销渠道。更带来了思维方式,组织架构的革新。关键词:统计学,大数据,企业管理

作者简介:冯首正,对外经济贸易大学统计学院在职人员高级课程研修班学员。归国留学生,曾任新西兰汉密尔顿华人会委员会委员、新西兰汉密尔顿华人学生会委员。曾获新西兰创新署颁发的创新创业大赛三等奖,中国驻新领事馆颁发的“优秀华人学生干部”等荣誉。

大数据市场营销实战

阿米巴经营的兴起预示着大数据时代的到来

稻盛和夫开始运用阿米巴管理的时候,他所意识到的问题是,市场的变化跟公司内部的生产模式调整之间缺乏一个自动调整的机制。于是,他将每个部门和本部门的绩效打包捆绑。这是一种高效的、让部门管理者重视部门内统计量的一种办法。单位时间内完成的产品数量,对原材料的利用率等统计量都会影响到最终的整体利润。

这种部门独立核算资源效益的模式,让每个阿米巴都具备盈利能力。部门之间的职能沟通,被阿米巴之间的买卖取而代之。内化市场调节功能,外化内部管理过程。这种独立核算机制,令阿米巴负责人对数据,统计量的把控能力也得到了提高。

阿米巴经营实际上是一种私有制向半公有制过渡的一种尝试。让劳动者能真正成为公司格局内的既得利益者,利于长期留住人才。

数据的本质

电子计算机的出现,人类社会开始产生大量电子化的数据。使用统计学软件可以对同类数据进行快速组织和重新编排以获得所需要的情报。

在过去的经营中,虽然企业主也要接触到大量的报表,但是由于没有计算机这样的工具,数据分析的复杂程度受到限制。在数字化程度极高的今天,企业主务必从头开始重新认识数据和企业管理中的统计学内容,并具备一定的数据分析能力。

结构化数据

结构化数据是使用二维或者三维的表组织的数据。我们常见的财务报表,产品信息表,都属于结构化数据。

这些二维表格是对同一组数据不同属性的描述,例如财务报表中,一行数据有时包含客户信息,产品信息,订单信息,这时候就需要进行表格拆分和重组,让数据表尽可能地一目了然。企业主了解企业运营状况和把握市场行情所需要的数据多半都属于结构化数据,也就是我们常说的关系型数据库。

半结构化数据

半结构化数据一般使用类似于JSON这种文件格式进行存储。每一个数据单元中,属性名和属性值都会存在。所以,同等数据量的数据,使用半结构化形式储存会占用更多储存空间。

半结构化数据易读性低。但是电脑调用半结构化数据库的速度会明显高于关系型数据库。在现代数据管理中,这种形式储结的数据能达到更好的检索性能。例如我们在搜索引擎中输入一些字符,计算机马上会进行预测和补充,从数量庞大的关键词选出预测词,这种快速响应庞大计算量,只有使用半结构化数据库才能做得到。

非结构化数据

非结构化数据接近于生活,例如文本,文章等,都属于非结构化数据。非结构化数据对于人来说易读性强。例如,聊天记录文本,基本上属于非结构化数据。

行业热词,热门话题等数据,也是通过对大量非结构化数据对于词频统计得出的。例如,对短文《百米赛跑的历史》进行词频统计如下

序号

字词

出现次数

出现频率%

1

10

5.1546

2

短跑

4

2.0619

3

4

2.0619

搜索引擎中的市场信息

在市场营销方面,企业主最需要了解的是搜索引擎数据和行业数据。前者在搜索引擎中可以找到,后者在一些B2C, B2B的平台中(如淘宝)可以找到。现代企业主务必要学会使用一些最基础的数据平台来为企业和市场把脉。搜索引擎是WEB 2.0时代里最重要的一类站点,善于利用搜索引擎数据就可以对市场行情有一个总体的了解。如下图所示。

在圣诞节时间附近,搜索“圣诞节产品”的人数次数激增,由此可以了解到,这些时间点都是投放广告和产品的好时机。

搜索引擎数据能让你快速掌握行业动态,通过对于不同热点的分析,准确把握客户群体的需求。

大数据企业管理实战

组织架构的扁平化

现代企业的组织结构变得更加可视化、扁平化。曾经,部门和等级的界限,是实体的办公区区分,楼层区分和等级汇报制度。现代企业管理中广泛运用诸如Slack的企业内部沟通软件,使用Scrum作为项目分解结构的管理,企业的层次结构变成了一张拓扑图。“上下”的意识逐步弱化。

现代SNS沟通工具的发展和快速的市场情况变化,部门员工之间的沟通更加紧密,更加频繁。“左右”的隔阂也在消失。

招聘软件的兴起,企业得以接触到更多候选人,员工也有了更多更广泛的选择,企业招聘到合适的员工和个人找到更合适的职位都变得更加容易。这一改变更是弱化了企业组织架构中“内外”的间隔。

作为企业主,应当充分拥抱和接纳扁平化的进程,这是经济,互联网社会发展的必然结果。扁平化的组织结构中出现的管理难题,则需要通过符合科学的统计学办法加以抵消。

大数据人力资源管理实战

构建人力资源的数据系统

---用大数据和统计学方法快速了解求职者和员工。

汇丰银行,IBM,谷歌等大公司都已建成完善的人力资源数据系统。主要的目的是更好地评估员工的价值。这些数据从入职之前就已经开始采集,员工的所有工作表现和业绩也记录在其中。有些甚至会包括一些心理测试结果。

人力资源数据系统包括了所有员工的结构化的数据,包括入职前和入职后两部分,入职前数据可能包括这些属性:MBTI性格测试结果,年龄,出生地,户籍地,学历,工作年数等。如果面试之前设置一些简单的数学,语文等测试题目,还可以将这些理科,文科成绩登记入其中。入职后的数据包括不同时间段的月薪,年薪,业绩,绩效,评分,平均商务成本,出差时长,销售利润率。对于非销售性质的职位可以按岗位性质增减属性,如可增加:月引流数量,内容产出数量,单位小时完成的任务数等。数据越丰富,统计学算法从中找出隐藏的影响因子的可能性就越大。

甄选纳入统计的属性

甄选数据是否要纳入模型的主要办法是使用相关系数进行判断。例如,我们想知道什么样的人适合销售部门,目前销售部门哪些员工具备增长潜力。于是,对于现有的销售数据先进行分析。由于最终的判断指标是销售额或者利润率。我们将用不同的属性指标(如员工年龄,员工工作年限,学历等)分别与销售额进行相关系数分析。

ρXY = Cov(X,Y) / √D(X) * √D(Y)

例如,分析年龄与销售额的关系,将所有员工的年龄和销售额做成一个2列多行表格,然后在EXCEL等数据分析软件中进行相关系数分析。最后得出的相关系数可能有三种结果,一是正相关:相关系数趋于1;二是负相关:相关系数趋于-1;三是其他情况。

在这次分析当中,我们希望了解一切可以拉动销售额的属性。对许多属性进行分析以后,尽量挑选正相关且相关系数很接近于1的属性进行下一步的建模。意味着此属性越大,则销售额越大。

建立数据模型

数据模型能有效预测员工的潜能和未来的增长性。

将建立两种数据模型:

面试官模型:仅使用入职前数据中与绩效指标相关系数高的属性进行建模。

成长性模型:使用所有可能的数据中与绩效指标相关系数高的属性进行建模。

对于销售部门所有员工进行属性与销售额的相关系数,排名靠前的如下:

仅使用入职前数据

属性名称      工作年限学历 上一份工作的月薪 年龄已婚

与销售额相关系数0.8    0.75        0.97      0.70.68

使用所有数据时

属性名称      薪资学历 入职年数 占所有订单的比重 每月拜访客户数出勤率

与销售额相关系数  0.90.75  0.8        0.9          0.87         0.84

由此我们已经知道,需要放在两个数据模型中的属性是哪些了。接下来需要用最小二乘法对所有属性进行参数估计。

minQ = Σn,i=1(yi - ^y)^2 = Σn,i=1(yi – ^β0 - ^β1*xi)^2

对于上述所有属性,分别与销售额(或类似业绩指标)进行最小二乘计算。就能得出该属性与销售额的估计参数β。最后将所有估计参数代入模型y  0·x0  1· x1 + β2·x2 + … +βn·xn。

得到如下参数估计结果:

仅使用入职前数据

属性名称工作年限学历上一份工作的月薪年龄 已婚

估计参数  1.22     1.05      1.03         1.01 1.02

使用所有数据时

属性名称 薪资学历 入职年数占所有订单的比重  每月拜访客户数出勤率

估计参数 1.5 1.32     1.33          1.98          1.78         1.56

面试官模型:y = 1.22a + 1.05b + 1.03c + 1.01d + 1.02e

成长性模型:y = 1.5a + 1.32b + 1.33c + 1.98d + 1.78e + 1.56f

在这个数据模型的例证里使用一些假设数据,找到对销售额影响最大的一些因素,并求出了估计参数。上述abcd等字母代表的是具体个体对应属性的数值。对于入职前的数据分析,能得出固定的y值,由于我们使用的全都是与销售额正相关的元素,y值越大则员工的价值越大。

对于入职后的员工,y值随着时间变化而变化,所以能绘制成函数图来解释员工的成长。员工入职时间越长,可预测性就越大。通过新老员工的数据对比,能对新员工的发展情况进行一定程度的预测。

还可以根据这些步骤建立一个内部调剂模型。如果此员工的数据放在销售部的分析结果并不理想,但是放在市场部的分析结果较好,则可以考虑执行调剂。

以上三个步骤建立人力资源数据系统:收集数据,甄选数据,建立模型。还可以运用在企业管理的更多方面,例如,用于分析供应商的优劣,用于分析客户的购买潜力等。

总结

21世纪是中国式管理的世纪。中国式管理并不是另起炉灶,重建系统,而是对于美国式管理和日本式管理的升级换代和因地制宜,。

要纳入美国式管理中的基层管理,加强可视化,可数据化的程度,用可量化的方式进行统计和汇总工作情况。建立合理的考核制度和指标。建立基层职责岗位白皮书,部门内部,外部沟通流程图。尽可能控制过程风险和职责真空。打造牢固基层。给员工提供学习企业文化和体制的良好环境,减少基层员工手足无措的状况,有效地配置人力资源,塑造浸染了企业文化的优秀人才的摇篮。

参考文献

Statistical Methods Applied to Project Management [2007] – Walt Lipke

Three Essays on Big Data Consumer Analytics in E-Commerce [2015] - Dokyun Lee

Essay on Statistics and Business Decision Making [2015] - Dr. Prasad Yenumula

How Are Statistics Used to Make Business Decisions? [2016] Lamar网站