学科分类
/ 2
31 个结果
  • 简介:主题标引是指根据文献内容及相关特征,赋予具有检索意义的相应语词标识的过程。《中国分类主题词表(第二版)》的使用,标志着我国图书编目工作进入了一个新的阶段,极大地提高了我国中文图书的分类、主题标引的一体化和文献检索的准确率,以及图书编目的质量和工作效率。同时,对从事标引工作的编目员来说,有了更高的要求,促进了我国文献标引工作向更高水平发展。

  • 标签: 《中国分类主题词表》 文献标引 电子版主题词表
  • 简介:在文献信息工作中,文献标引是实现文献存贮和文献检索的重要手段。而文献标引学则是研究文献标引语言及其发展规律的一门新学科。它是信息时代的产物,是分类法语言与主题法语言相互渗透的必然结果,是分类标引工作与主题标引工作理论与实践相结合的总结和概括。

  • 标签: 文献标引 标引语言 文献检索 分类法 标引工作 新学科
  • 简介:目前大多数自动标引方法不能有效利用文本中包含的多个特征。而支持向量机、条件随机场模型等统计机器学习模型能够有效利用文本包含的多种特征进行关键词提取。同时,由于各种自动标引模型性能各异,综合利用各种模型进行集成学习方式的自动标引,能够提高自动标引的质量。为了进一步提高自动标引的质量,本文试图整合统计机器学习模型与集成学习方法的优势,对文档进行基于多分类模型综合投票方式的自动标引。实验结果表明,基于集成学习方法的自动标引能提高标引结果的查准率和召回率。另外,集成学习标引模型中,基分类器加权的标引结果,优于基分类器未加权的标引结果。

  • 标签: 自动标引 关键词提取 集成学习
  • 简介:对于影视资料分类标引的问题,提出了应以流行的、通用的、大众所熟悉的电影分类自然语言分类标引为主,并设置《影视资料分类标引参考主题词表》,旨在提高影视资料的检准率和检全率。

  • 标签: 声像资料 分类标引 主题标引
  • 简介:网络环境下,文献信息具有数量多、增长快、文献信息中的新词层出不穷等特点。标引是对信息资源进行组织的有效手段和重要环节,标引的质量和效率直接影响信息组织的质量和速度。为了比较受控标引、自由标引和自动标引三种标引方式的标引性能,本文从定量的角度对三种标引方式的相符度、专指度、标引深度及通用词数进行了测试对比,并分析了它们的综合性能。最后,分析讨论了网络环境下文本信息标引方式的选择和发展趋势。表5。图1。参考文献9。

  • 标签: 受控标引 自由标引 自动标引 手工标引 标引性能
  • 简介:黄页分类工作是电话号码簿编辑的主要工作之一。黄页公司一直致力于探索运用计算机技术对黄页数据分类进行自动标引。1998年开始进行人机对话的计算机自动切分工作,现切分结果的正确率达到了60%以上,标引速度达到了每小时1200条。

  • 标签: 黄页分类 电话号码簿 自动标引 计算机
  • 简介:本文叙述了目前人们可以通过网络数据库实现全文检索的情况下,自动标引的重要性,它可以针对海量信息进行检索和挖掘,可以把人类的思维同计算机技术相结合,使检索信息更完整、全面。

  • 标签: 中文数据库 索引 自动标引
  • 简介:由于《中国图书馆分类法》的类目数目庞大和文献在各类目上分布的不均衡,导致基于机器统计学习的自动分类技术在此类多层分类上的力不从心。基于人工标引经验的自动分类试图通过情报检索语言兼容互换的原理解决这一问题,然而直接应用标引词串对分类进行匹配在实际应用中产生了一系列的问题。本文试图通过两种分类技术相结合的方法对信息资源进行分类,提出了用相关度度量来测定关键词和类目概念之间的关联,构建关键词、分类号、归属度三元组矩阵的方法进行分类匹配,并在小规模的测试集上得到了较好的效果。本文详细讨论此种分类器的构建原理、构建方法以及分类流程,并对该方法存在的不足进行了分析。

  • 标签: 《中国图书馆分类法》 分类矩阵 自动分类
  • 简介:图书分类标引工作是图书馆组织藏书和揭示藏书的一种手段,其目的是为了给读者(用户)提供馆藏信息,达到利用图书的目的。因此,图书分类标引工作非常重要,必须根据图书的内容及其论述的方面、著作目的、本馆的任务和读者需要来进行。图书分类标引工作是十分细致复杂的,对标引质量要求较高,如果标引质量不高,就会影响为读者服务,因此,图书分类

  • 标签: 图书分类标引 中学图书馆 标引质量 图书馆组织 读者需要 馆藏信息
  • 简介:简要介绍军用信息检索语言分类主题映射关系的概念、映射规则、隶属细则,《军用分类主题映射表》的映射方法、软件工具,专项审查、质量量化评估及今后研究方向。

  • 标签: 军用信息检索语言 分类主题一体化 科研方向
  • 简介:数字资源建设是图书馆的一个重要研究领域,通过主题爬虫自动收集网络数字资源是数字资源建设的一种重要途径;主题爬虫是主题搜索引擎的重要组成部分,主题搜索算法是主题爬虫的核心;按照评价链接价值方式的不同,对现有的主题搜索算法进行分类,系统分析、比较了每类算法的特点和优缺点。

  • 标签: 数字资源建设 主题爬虫 搜索算法
  • 简介:担负着传播科学与知识信息载体(媒体)之一的期刊,在高校的教学与科研中正起着越来越重要的作用。期刊具有“广”、“新”、“快”、“专”的优势一一比图书传播信息内容与范围广、传播信息内容新、传播信息速度快;比报纸传播信息容量大,且又专门系统深入,及时地推出科学的最新研究成果,反映科学发展的最新动向与整体流向,是高校师生迅速准确地把握科学发展动态,以便深入地

  • 标签: 现行期刊 论文索引 主题索引 图书馆
  • 简介:从理论与实践的结合点上阐释了图书馆发展的动力--办馆观念创新,主力--管理思路创新,潜力--科研模式创新,活力--服务项目创新,后力--人才培育创新.针对现状与长远发展作出战略性谋划,提出多种建议与措施.

  • 标签: 图书馆 发展 创新 办馆观念 图书馆管理 人才培养
  • 简介:法律文献检索尤其重视检索的精准度,编制适用于法律主题标引的词表成为当务之急。编制《中国法律主题词表》,应当以中国法律体系为基础,参考已有专题词表的体例,借鉴其他国家和地区法律主题词表的长处,适用于两岸四地及外文法律文献主题标引实践,兼容主流的标引体系,适宜机器标引,并在法律文献标引实践中予以推广。

  • 标签: 法律文献 主题词表编制 主题标引 自动标引
  • 简介:为跟踪国外图书馆管理的最新研究进展,以2005-2012年英国《图书馆管理》刊载的论文为数据源,借助词频分析与可视化方法对该领域的研究状况进行描述,在此基础上确定9个主题对研究论文的内容进行归纳整理,包括变革管理、公共图书馆研究、资源共享与合作、图书馆战略管理、图书馆质量管理、人力资源管理、图书馆营销、图书馆绩效评估、图书馆业务管理。

  • 标签: 图书馆管理 图书馆业务 主题分析
  • 简介:电子政务主题词表是电子政务信息的组织和检索的重要语义工具。传统手工编制叙词表的方法耗费大量人力、物力,成本高、历时长,已不再适用于网络环境。本文拟以共青团电子政务词表为例,探讨用计算机自动构建叙词表的方法。主要技术要点包括:利用N-gram方法进行选词、结合Dice测度、相似度算法、模式匹配等多种技术来自动识别词汇的等同、等级和相关关系。最后评测了自动构建的电子政务主题词表的性能。

  • 标签: 电子政务 叙词表 词表自动构建 词间关系识别 N—gram方法