教育大数据的应用与实践

(整期优先)网络出版时间:2021-02-25
/ 3


教育大数据的应用与实践

周清

对外经济贸易大学统计学院 北京 100192

关键大数据技术AI智能在线教育人才培养应用实践

摘要:大数据技术对社会发展和各行各业技术进步有着重要意义。大数据技术在教育行业中有巨大潜力,教育承担着为国家培养人才的重任,现代教育需要大数据技术体系的支持。教育大数据的核心基础是数据,教育数据总体分类为学生数据、教师数据和学校数据。随着AI技术的进步,使在线教育领域对大数据的积累和使用不断发展。教育大数据的驱动价值体现在教育管理科学化,教学模式规范化,学生学习个性化,教育评价系统化,教育服务人性化。教育大数据发展前景十分可观,使教育质量大幅度提高,为国家培养更多适应新时代发展的优秀人才。

大数据技术是进入21世纪以来发展最为迅速的技术体系之一,随着近些年世界互联网行业和移动互联网行业的快速成长,大数据技术也迎来了发展的黄金时期。从数据的收集和存储到数据的计算和分析等关键环节都有了革命性的技术产出,例如:基于文件存储的HDFS、基于数据存储的HBase、基于数据离线分析和计算的Hadoop MapReduce等等,这些技术的产生使我们借助大数据来提升生产效率的想法具备了可行性条件。在大数据技术应用的过程中,范围越来越广,使用的数据规模也越来越大。大数据技术彻底改变了过去计算速度慢、运维复杂等问题,并产生了应对这类问题的解决方案:基于分布式调度的ZooKeeper、基于实时流计算的Stream/Spark Streaming等。大数据技术的迭代使我们可应用的数据规模从大量数据升级为海量数据,从离线的分析计算升级为在线的实时分析和计算,愈发强大的数据工具让我们可以使用更多的数据来更快的反馈更准确的结果,从而让大数据技术应用在了更多细分垂直领域中,比如:电商购物、地图路况、天气预测、体育竞技、教育行业等。电商购物中使用的关联推荐技术,就是使用大量电商会员已购买的购物数据结合电商会员正在购买的商品数据进行关联,从而向正在购买的电商会员提供相关联的推荐商品。地图软件中的路况数据就是使用同样路段中不同时间段的历史车流数据做为样本进行训练,从而对下一时段的路段做交通拥堵程度进行预测。提升天气预测的准确性,我们也需要结合海量的当地历史天气数据和多达几十种影响气候环境的特征维度相结合进行综合的训练和评估才能得出准确性更高的预测结果。随着大数据在应用领域的深入探索,带来的影响力也是与日俱增,大数据已经成为各垂直行业必须要研究和突破的核心课题之一。以大数据为桥梁,可以让我们在各种维度上领先竞争对手产生优势壁垒,也可以让我们实现弯道超车缩短差距。当大数据技术在行业内发展到一定程度,就可以产生标准,伴随着标准体系的建设和完善,在行业内就可以催生出生态产业链,就可以让整个行业更加成熟,形成行业发展的良性循环生态。

在教育行业领域中,大数据技术的产业驱动价值也已经走入教育行业内专业人员的视野。教育大数据从战略高度应定位为推动教育变革的新型战略资产,推进教育领域综合改革的科学力量以及发展智慧教育的基石.教育大数据的最终价值应体现在与教育主流业务的深度融合以及持续推动教育系统的智慧化变革上,具体表现在驱动教育管理科学化,驱动教学模式改革,驱动个性化学习真正实现,驱动教育评价体系重构,驱动科学研究范式转型,驱动教育服务更具人性化。大数据技术越来越重要的地位和影响力也催生了教育领域多个研究方向和专业,同时也在吸引专业领域内的从业人员积极的参与研究。之所以要大力的推动教育大数据的发展,这要从教育行业的重要性说起,我国的教育承担着为国家培养人才的重要责任,培养适应时代发展的优秀人才,需要现代教育的软硬件系统能够跟上时代发展的要求,也就是说在培养人才的同时,与其相匹配的软硬件系统和设施也需要进行快速的迭代。而在迭代的过程中,一个主要的驱动力就是大数据,无论是从模式研究,还是落地应用,都需要大数据为我们提供有指导意义的参考。大数据技术在快速的迭代发展过程中,各种新理论、新模式、新技术不断的涌现,教育行业也急需适应新时代的发展,通过变革的方式来达到自我迭代的目标。在教育行业这个细分垂直领域中,专业研究人员也越来越意识到借助新时代产生的新技术和新工具可以极大的提升教育教学质量,有助于我们通过大数据的宏观性来优化全局管理策略,也有助于我们通过大数据的微观性来保证自身鲜明特征前提下优化具体实施细节、优化教育教学过程,从而实现整体推动教育系统全盘性变革的目标和教育质量的提高。从历史经验中看,教育相关的数据本身就具备较高的参考价值,比如:学生的学习成绩、课程评价,教师在教学中提练出来的课件和针对不同特征学生的教学方法,学校在办学过程中总结的教师管理方法和学习管理方法等。这些数据对教育行业整体都是难得的经验和资源积累,但在大数据技术之前,这些经验和资源的积累都是靠口口相传的方式小范围流转,没有统一的标准,同时共享渠道也不畅通,不论是学生、教师还是学校,都不能以较低的成本获取对应的经验和资源,但通过大数据技术的兴起和应用,可以解决相当一部分此类问题,比如获取对应角色的经验积累的成本问题。综上,迭代变革传统教育行业成为大势所趋,而使用大数据技术作为驱动工具也势在必行。

从教育行业和大数据结合的角度,衍生出了一个新的概念:教育大数据。从字面意思看,教育大数据同时涵盖了数据和技术两个层次维度,其中地位最为首要的是数据。教育大数据的核心基础是数据,数据质量和数量积累到一定程度就可以使对应技术产生质的变化。教育数据总体可根据对象类型分类为学生数据、教师数据和学校数据,这也是我们所说的数据第一级分类;学生数据的下一级分类可根据行为和结果维度分类为学习行为数据、成绩分布数据和效果反馈数据;教师数据的下一级分类可据根水平维度分类为教师等级数据、教学质量数据和科研水平数据;学校数据的下一级分类可根据环境和服务维度分类为学习环境数据、教师管理数据和舆情管理数据。通过不同一级分类的二级分类两两搭配可以组合为新的特征维度,例如:学生数据中的成绩分布数据和教师数据中的科研水平数据可以组合为科研项目的成本收益数据来评估一个科研项目的实际价值、学校数据中的舆情管理数据和学生数据中的效果反馈数据也可以组合成为学校中教师水平的客观评价指标。除了特征指标的组合模式带来新的特征维度以外,还可以通过二级分类继续细分的思路产生新的三级分类特征,每个一新层级的特征组合数量是呈指数级的增长,让我们可用的特征维度越来越多,可评价的指标也会越来越丰富,从而使学生、教师、学校的评价越来越符合真实水平,从而得到更加客观的数据来指导教育大数据产业的迭代思路。教育大数据直接产生于各种教育活动(包括教学活动、管理活动、科研活动、校园活动等),每个教育利益相关者既是教育数据的生产者也是教育数据的消费者。教育大数据具有明确的目标指向性,即指向教育发展,能在提升教育质量、促进教育公平、实现个性化学习、优化教育资源配置、辅助教育科学决策等方面发挥有效作用在数据层面。目前积累运用最多的是在线教育行业。在2020年的新冠疫情期间,使得在线教育在教和学两侧用户都有较大幅度的增长,也促使在线教育行业可以积累到更多的学生、教师和教育机构的数据。这些在规模上有明显增长的海量数据也会在推动大数据技术迭代的同时驱动教育行业在教育模式方法上的变革。在2020年,多家在线教育机构都也都推出了具备各自特色的多种新产品面市,在给予用户多种选择的同时也体现了大数据在教育模式改革中所起到的巨大驱动作用,持续优化教与学,辅助教师开展精准教学,辅助学生实现个性化学习。此外,在线教育产业还可以收集另一种形式的数据,即:非结构化数据,比如:在上课过程中录制的音频、视频等数据,此类数据不能通过对待结构化数据一样来进行分析和计算,这就会促进大数据技术中的另外一个方向的发展,这个方向叫做:智能化。AI智能也是近几年快速发展并应用的大数据技术,通过对音、视频的AI智能识别和分析,也可以起到对传统结构化数据的补充作用,除了对于数据内容丰富程度的补充,AI智能化还能在数据维度上进行补充,比如上课过程中学生的学习状态、教师的教学状态等维度特征等。大数据AI智能化方向的技术还在急速发展的进程中,随着AI技术的进步,教育行业非结构化数据可挖掘的潜力也是非常巨大的,可以做为后续教育大数据的一个重点方向进行数据积累、人才培养和价值输出。

展望教育大数据的前景十分可观。教育大数据是一种无形的战略资产、是一座可无限开采的“金矿”,充分的挖掘与应用是实现数据“资产”增值的唯一途径。大规模的使用大数据,一方面我们可以充分的开采这个“金矿”,达到获取到我们想要的有价值的海量资源的目的;另一方面我们也可以优化开采资源的工具,提升开采的容量和提炼的效率,达到对资源的充分利用的目的。两个方面的相关技术提升对于数据资源和数据工具都具有正向的意义,是可以互相促进从而实现双向良性循环的发展节奏。从现阶段的发展来看,在线教育领域对于大数据的积累和使用,可以做为传统教育领域的一个成功经验来借鉴,通过大数据的积累和分析产出有价值的传统教育新模式新方法,再通过反馈机制来对新模式新方法进行迭代和改进。从未来的发展来看,需要重点发力大数据AI智能化的应用,将其它行业中产出的新AI技术应用到在线教育和传统教育的大数据分析和计算中,产出更多意想不到的价值输出,也助力AI技术在新的领域落地,为我国的大数据AI智能产业贡献更多的价值产出,实现我国大数据AI智能化领域在世界范围内的弯道超车,形成技术壁垒和国际竞争力,从而达到教育行业和大数据行业双赢的效果。

综上所述,教育大数据是一个无论从当前还是从未来看,都是一个有着无限潜力的垂直行业发展方向。在大数据时代背景下,数据无所不在,许多过去难以量化的信息都将转化为数据进行存储和处理。从数据规模、产品迭代到技术发展的良性循环,可以实现健康快速的行业和技术发展,在AI技术的加持下,产品、技术的想象力也得到了增强。但在乐观的发展状态下,我们也需要及时发现问题和不足,例如:用户隐私的保护和数据共享的信息安全性等。在教育大数据刚开始快速发展的阶段,我们一定要意识到这些问题如果没有合理的预防方案会引发严重的后果,甚至是对整个教育大数据行业带来危机。除了我们自身在技术层面对此类问题进行预防和规避,在国家法律和数据通迅标准层面也需要努力推动,随着国家数据隐私保护法案和数据交换标准等法律法规、标准条款的制定,这些问题会得以解决。我们相信有学校和在线教育为主体的教育机构输出数据、技术和产品能力不断提高,有各级政府教育主管部门和国家法律等部门输出政策法规和数据接口标准法案作为理论和法律依据保驾护航,教育大数据在教育行业领域内的可以得到更好地应用和发展,从而促进教育质量的整体提高,培养出更多符合时代标准,适应新时代飞速发展的人才。