学科分类
/ 25
500 个结果
  • 简介:分类在数据挖掘中是一项非常重要的任务,决策方法是一种常用的方法。本文重点介绍了决策建立的基本原理,对算法所面临的问题进行了阐述,为数据分类研究者提供借鉴.

  • 标签: 数据挖掘 决策树算法 分类
  • 简介:摘要在机器学习与大数据飞速发展的21世纪,各种不同的算法成为了推动发展的基石.而作为十大经典算法之一的决策算法是机器学习中十分重要的一种算法。本文对决策算法的原理,发展历程以及在现实生活中的基本应用进行介绍,并突出说明了决策算法所涉及的几种核心技术和几种具有代表性的算法模式。

  • 标签: 机器学习 算法 决策树
  • 简介:利用决策算法了解消费者网络购物时的影响因素,有利于商家改进营销策略.采用随机抽样的方式对500名被试进行问卷调查.对影响消费者网络购物决策的因素建立分类回归.结果表明,决策可以有效地用于网络购物决策的分类预测;按重要性提取规则,消费者自身的网络购物经验对网络购物决策影响较大,消费者对网络购物的财务风险、隐私风险等风险感知因素也是预测网络购物决策的重要指标,除此之外商家提供的售后服务、界面操作的便利性以及消费者自身的特征也会在一定程度上反映购物决策.

  • 标签: 决策树 分类回归树 网络购物 决策
  • 简介:通过扩充情感词典词基数,新建中立词词典,引入网络流行词等方式丰富情感词典,提高分词后情感词匹配的准确性;以某评价类网站网民评论作为原始数据进行分词,提取相应的正向情感分数,负向情感分数,中立情感词个数,评论情感总分值等特征,通过对连续数据的规约提炼离散属性,按照信息增益最大原则生成决策进行评论的情感分类,去除小概率节点后进行两次实验,对好评的识别率达到90%,对差评的识别率达到92%。对中评的识别率达到75%。

  • 标签: 情感词典 特征 信息增益 决策树
  • 简介:随着现实生活中数据集规模的不断增大,提出一个有效的分类算法势在必行。现今很多已有的算法是针对减少支持向量的数目来提高分类的效率,文章提出了一个基于决策的支持向量机算法,旨在通过减少测试集的数目来提高支持向量机在测试阶段的分类速度。基于决策的支持向量机算法的思想是利用决策算出支持向量机的大致决策边界,决策上含有单变量节点和SVM节点,支持向量机用来对靠近决策边界的重要的数据点进行分类,剩下的相对不重要的数据点用决策对其进行快速分类。

  • 标签: 支持向量机 决策树 决策世界
  • 简介:摘要本研究利用缨帽变换获取绿度、亮度以及湿度三个特征波段,并结合植被覆盖度(VFC)构建地物光谱特征曲线。此外,通过估算上述各波段的灰度共生矩阵构建地物纹理特征曲线。在此基础上,分析地物的光谱特征和纹理特征,建立分类决策模型,并在envi软件中实现决策分类。为了探究决策分类法的可行性,以史灌河地区TM30m分辨率影像进行了土地覆盖决策分类试验与分析,并利用混淆矩阵对其结果进行精度评价。结果显示分类精度可达77.72%,Kappa系数0.69,具有一定的参考价值。

  • 标签: 决策树 植被覆盖度 缨帽变换 纹理特征 史灌河
  • 简介:摘要车险高赔付问题是车险发展的瓶颈,识别影响车险高赔付率的风险因素,防范控制风险,减少损失对于车险乃至财产保险公司的健康发展具有重要意义。本文从出险次数的角度,对影响车险赔付的三类风险因素车辆风险、被保险人风险、投保特征风险进行了决策分析,在此基础上提出了相关的政策建议。

  • 标签: 赔付率 出险次数 决策树
  • 简介:数据挖掘作为一种发现大量数据中潜在信息的数据分析方法和技术,已经成为相关各界关注的热点。其中,决策技术以其出色的数据分析效率、直观易懂的结果展示等特点,倍受广大用户的青睐。文章首先对决策技术进行较为详尽的探讨,然后利用SAS/EM工具,对该技术在客户关系管理中的应用进行了初步尝试。

  • 标签: 统计 数据挖掘 决策树 SAS/EM
  • 简介:小学阶段的学生评价机制是为了帮助学生养成良好学习生活习惯的重要手段之一。我国现阶段主要是班主任老师以评价手册的方式对每个同学进行学期评价总结,还没有用数据挖掘的科学方式构建评价数据模型的先例,数据挖掘作为当代最有效的科学预测技术以此研究学生评价模型具有重要意义。本文使用数据挖掘中常用的决策算法,以北京市西城区西单小学五六年级全体学生平时表现得分及班主任老师对学生的评价作为数据来源,对小学生评价问题做出分析。通过小学生的纪律,卫生健康,习惯,成绩等属性构建班主任评价的决策模型。

  • 标签: 小学生评价模型 决策树算法 二类分类
  • 简介:ID3算法是示例学习中建立决策的一种重要的方法.介绍了ID3决策算法的基本思想,讨论了ID3决策算法中的难点和不足.结合实例给出了利用信息增益度法来改进ID3算法的详细过程.

  • 标签: ID3 决策树 算法
  • 简介:本文作者从实际应用出发,对现存数据挖掘决策分类方法进行了研究,并应用到系统当中,实现了决策支持模块。关键词数掘挖掘;决策算法;改进;实现中图分类号TP301.6文献标识码A文章编号1007-9599(2010)04-0000-02DataMiningDecisionTreeImprovement&ImplementationXiaYan,ZhouXiaohong,WangDong(ChangchunTechnologyCollege,Changchun130033,China)AbstractTheauthorstudiedonexistingDataMiningdecisiontreeclassificationmethodbasedonthepracticalapplication,andappliedtothesystem,achievedadecisionsupportmodule.KeywordsDataMining;Decisiontreealgorithm;Improve;Achieve随着数据库技术的不断发展及数据库管理系统的广泛应用,数据库中存储的数据量急剧增大,在大量的数据背后隐藏着许多重要的信息,如果能把这些信息从数据库中抽取出来,将会产生重要的作用。因此,数据挖掘涉及的学科领域逐渐扩大,数据挖掘的方法也在不断地改进和提高。分类在数据挖掘中是一项非常重要的任务,分类算法可以分为决策分类算法、遗传算法、神经网络方法、K-最近邻分类算法等。这里,以疾病防控与儿童免疫管理系统中决策支持子系统的开发过程为例,对决策分类算法的改进及在实际中的应用进行阐述。一、数据选取和数据预处理在本系统中,以预防接种中遇到异常反应后记录的“异常反应调查表”中的数据为例进行说明。具体实现过程详细说明首先输入训练集,由于在真实的SQLServer数据库当中,为了降低存储要求和减少存储时间,并非真正存储每个数据项的属性值,而是用存储数字来对应相应的意义,如在数据库的数据表中,“性别”字段中“1”代表“男”、“2”代表“女”,反应到程序页面时再映射回原来的值,为了说理清晰又限于篇幅,这里只将所有数据集中有代表性的十几组数据作为分类模型创建的输入训练集。表1判断是否需要计划外加强免疫的属性表儿童编号月龄出生状态常住地上次注射后反应是否需要计划外加强免疫0405102<=2正常产城市无不良反应否0405495<=2正常产农村无不良反应否0401342>5正常产城市无不良反应是04054352…5正常产城市轻度反应是04065342…5非正常产城市重度反应是04072342…5非正常产农村重度反应否0401544>5非正常产农村重度反应是0408519<=2正常产城市轻度反应否0404566<=2非正常产城市重度反应是04035472…5非正常产城市轻度反应是0401534<=2非正常产农村轻度反应是0405856>5正常产农村轻度反应是0409533>5非正常产城市无不良反应是04053442…5正常产农村轻度反应否二、生成决策对训练集的每一个属性,计算其信息增益。以“月龄”属性为例,每个结点中的正反例的个数分别为[2,3]、3,2、4,0,分别计算如下info2,3==0.971;info3,2==0.971;info4,0=0;计算信息熵E(月龄)==0.693;计算该属性的信息增益量,选取信息增益最大的属性为节点,按该属性的值划分数据集合Gain(月龄)=Info(9,5)-E(月龄)=0.940-0.693=0.247;同理,对“注射反应”属性、“出生状态”属性、“常住地”属性都可计算每个结点的正反例的个数(由于篇幅有限,不作计算)。通过对各属性信息增益的计算结果,选择“月龄”属性作为根节点,然后划分“月龄<=2”的所有可能性。计算当“月龄<=2”时,“注射反应”、“出生状态”、“常住地”的信息增益值Gain(注射反应)=Info(2,3)-E(注射反应)=0.971-0.4=0.571;Gain(出生状态)=Info(2,3)-E(出生状态)=0.971-0=0.971;Gain(常住地)=Info(2,3)-E(常住地)=0.972-0.951=0.020;同理考虑“月龄>5”的情况,由于“月龄>5”时,各个节点都是纯节点,所以不再划分。三、产生决策规则遍历决策,输出叶结点类属性值,用IF—THEN形式表达为IF(月龄2…5AND注射反应=无)THEN(类别=是)IF(月龄2…5AND注射反应=轻)THEN(类别=是)IF(月龄2…5AND注射反应=重AND出生状态=正常产)THEN(类别=是)IF(月龄2…5AND注射反应=重AND出生状态=非正常产AND常住地=城市)THEN(类别=否)IF(月龄2…5AND注射反应=重AND出生状态=非正常产AND常住地=农村)THEN(类别=是)……依此类推,共可产生十三条规则。四、决策支持子系统的分析用上述基于决策的分类算法所得到的模型生成的规则来预测测试集中的未知数据属于哪一类,并通过该模型的测试结果与实际情况相吻合的准确率来判断该决策是否有效。首先,用整个数据集中2/3的数据作为训练集按照基于决策的分类算法来建立模型,生成一棵决策。然后,用余下的1/3的数据作为测试集,通过创建的模型进行预测,并将预测结果和实际值进行比较。如果准确率达到或超过事先确定的阈值,则可以认定该模型对于数据分类是有效的,能够在实际中应用;反之,则认定该模型的分类效果不好,需要按以上步骤来重新判断,直到分类准确率达到预定的阈值为止。在本系统中,经过测试预测准确率已达到87%,在可以接受的范围内,所以算法是有效、可行的。参考文献1陈文伟,黄金才.数据仓库与数据挖掘.人民邮电出版社,20042王万森.人工智能原理及应用.电子工业出版社,20003范明,孟小峰.数据挖掘——概念与技术.机械工业出版社,2001作者简介夏琰(1980-),女,吉林长春人。长春职业技术学院信息技术分院,教师,讲师,硕士,研究方向为计算机应用。

  • 标签:
  • 简介:要针对决策ID3算法复杂的对数运算以及属性取值多向依赖的缺陷,提出了一种改进的CEID3算法。该方法引入粗糙集论中属性重要度和关联度的概念,并依据这两个概念对决策ID3算法进行有效改进。仿真结果表明,新算法简化了运算使得终形成的决策更加符合实际需求。

  • 标签: 决策树 粗糙集论 重要度 关联度
  • 简介:摘要:全面实施教学计划思想政治教育是新时代大学专业课程改革的关键环节。为了引导学生在学习中保持强烈的求知欲,知晓自己所肩负的使命,在科学研究中端正态度,将思政教育中的辩证统一思想运用于《机器学习》中,树立仔细、认真、研究的科学研究精神。以专业核心课《机器学习》中的决策核心模块为例,将思想政治教育中的部分要害与其紧密结合,在此基础上利用典型教学案例拓宽教学手段。

  • 标签: 课程思政 机器学习 决策树 教学案例
  • 简介:目的:探讨手术切口决策在提高手术室护士评估切口分类水平中的应用效果。方法:对手术室护士进行专业培训,随机抽取培训前2015年11月~2016年5月,培训后2016年8月~2017年2月的手术医师的切口分类及手术室护士手术切口分类进行统计分析。结果:培训后手术室护士的分类得分正确率提高,术后切口感染率降低。结论:应用决策后,手术室护士的分类得分有很大提高,手术切口决策值得推荐使用。

  • 标签: 决策树 手术室护士 手术切口分类 应用
  • 简介:电网企业当前面临的客户风险主要体现在客户拖欠电费及偷窃电两方面。为降低电力客户在拖欠电费方面的风险,文章在分析了引起电力客户拖欠电费原因的基础上,深入挖掘分析客户缴费、欠费行为,设计了欠费风险识别相关的关键影响变量,运用决策算法建立了客户欠费风险识别模型,进行客户欠费风险预测。利用该模型,针对高风险客户提前采取相应策略和措施,可改变以往事后欠费管理的被动局面,实现降低电力客户欠费风险的目的。

  • 标签: 数据挖掘 电力营销 欠费风险 决策树
  • 简介:摘要电网企业的主要经营利润来自于电费回收。结合电力客户的基本属性信息,关联不同类型用电客户的缴欠费行为,对客户欠费风险进行预测,便于电网公司针对不同风险等级客户提前制定差异化的电费催缴策略和防范措施,缩短企业的电费回收周期,有效降低经营压力。

  • 标签: 欠费风险 决策树 电费回收
  • 简介:决策是数据挖掘分类问题算法中一种性能较好的算法,本文主要研究自决策在数据挖掘中应用以来存在问题,主要是可扩展性问题。综述了国内外针对此问题所提出的解决方法,以及分析了改进算法的优缺点,以便有利于对决策关键问题,即扩展性问题的研究。同时本论文中所研究的算法的思想也有助于数据挖掘中其它领域解决大数据集问题。

  • 标签: 决策树 分类挖掘 可扩展性
  • 简介:基于决策类划分多变量决策是一种新型的决策算法,该算法对训练集分区进行多变量决策运算后,可能取得多个决策逻辑规则。最优逻辑约简法则使用逻辑运算及选择运算构造出一种择优运算方式,以取得最优的逻辑约简规则,是对该算法的一种有效补充。实验证明该算法在取得最优决策逻辑规则方面效果明显,但在现实情况中可依据实际情况不同对引用此法则进行取舍。

  • 标签: 多变量 决策树 约简 逻辑规则 逻辑运算
  • 简介:摘要任何的企业或者事业单位在投资过程中都需要对以后所面临的风险有一个预估,并根据一定的方式来对工程的经济做出决策,投资者如果想要在竞争激烈的市场竞争中获得理想的收益,就必须能够以科学合理的方式对自己的经济做出最合适的决策。而以资金时间价值作为基础,并通过工程经济决策的方式对投入的资金项目风险有一个科学的认知,已经成为一种新的预估方式。本文将对这一方法进行一定的研究探析。

  • 标签: 资金时间 价值 工程经济决策树 探析