首页
期刊导航
期刊检索
论文检索
新闻中心
期刊
期刊
论文
首页
>
《中国索引》
>
2009年1期
>
一个基于特征向量的近似网页去重算法
一个基于特征向量的近似网页去重算法
打印
分享
在线阅读
下载PDF
导出详情
摘要
在搜索引擎的检索结果页面中,用户经常会得到内容相似的重复页面,它们中大多是由于网站之间转载造成的。为提高检索效率和用户满意度,提出一种基于特征向量的大规模中文近似网页检测算法DDW(Detectnear—DuplicateWebPages)。试验证明,比起其他网页去重算法(I—Match),DDW具有很好的抵抗噪声的能力及近似线性的时间和空间复杂度,在大规模实验中获得良好测试结果。
DOI
rj8ygwmy40/676034
作者
曹玉娟;牛振东;彭学平;江鹏
机构地区
不详
出处
《中国索引》
2009年1期
关键词
网页去重算法
特征向量
近似网页
支持向量机
分类
[文化科学][情报学]
出版日期
2009年01月11日(中国期刊网平台首次上网日期,不代表论文的发表时间)
相关文献
1
张小娣;宋余庆.
基于网页正文逻辑段落和长句提取的网页去重算法
.情报学,2012-02.
2
赵鹏喜.
基于LPQ特征向量和PCA的帘子布疵点识别算法研究
.高等教育学,2015-04.
3
.
特征值与特征向量
.教育学,2015-05.
4
刘干中.
特征向量和奇异向量的扰动界
.成人教育学,2001-03.
5
陈永衡;彭西芹.
广义特征向量与过渡矩阵
.教育学,2014-04.
6
李小新.
一类混合图的特征值与特征向量
.教育学,2007-05.
7
柯铧;柯科.
伴随矩阵的特征值与特征向量
.教育学,2013-05.
8
贤锋.
最大特征值及其特征向量的应用
.高等教育学,2006-05.
9
朱凤娟.
矩阵特征值和特征向量的逆问题
.教育学,2007-03.
10
刘化波;李臣顺.
非正则图的Laplacian特征值与特征向量
.职业技术教育学,2005-04.
来源期刊
中国索引
2009年1期
相关推荐
特征向量的计量装置故障诊断分析
去造一个草原
高中数学特征值和特征向量解题策略
为你的班级设计一个网页
n阶方阵A与其伴随矩阵A^*的特征值与特征向量
同分类资源
更多
[情报学]
浅淡现代信息技术发展的负面效应
[情报学]
我国中小学图书馆实施信息素质教育的途径
[情报学]
报刊全开架的实践与思考
[情报学]
浅谈中学图书馆采访工作
[情报学]
《藏书纪事诗》引文得失
相关关键词
网页去重算法
特征向量
近似网页
支持向量机
返回顶部