简介:LDA主题模型是文本挖掘领域的重要算法,同时在推荐系统当中也有不错的表现.通过LDA主题模型挖掘用户感兴趣的主题,是目前最常用的用户兴趣主题挖掘方法之一.为了提高LDA主题模型应用在推荐系统时的推荐质量,我们提出了一种基于负样本进行学习的方法negLDA.通过创造出负样本来学习用户对物品的负面预测评分,同时结合正样本学习得到的正面预测评分,从正反两个方面进行综合评测,从而更加精确地衡量出用户对物品的预测评分.通过在MoviesLens-100k、MovieLens-1M、FilmTrust这三个数据集上的实验,表明所提出的算法在精确率、召回率、AUC三个指标上相比传统算法均有一定改进.
简介:大数据分析是检查具有各种类型的大量数据并快速生成以识别隐藏模式、未知相关性和其他有用信息的过程。在现代汽车集团的研发中心,有许多类型的机器能够以前所未有的规模生成数据。作者开发了一种名为VDMS的车辆信号采集设备。这种类型的传感器每天在大数据系统上存储超过1TB的数据。因此,分析不断增加的数据量和高速流传感器数据的能力是必不可少的。本文研究了传感器数据的分析方法,首先,建立了从信号数据相关性分析到分类模型的分析过程,并开发了针对信号优化的分析方法。另外,提出了一种将异常信号数据形成图案并检测特定图案的方法。