基于分布式电力资源库的搜索引擎框架

(整期优先)网络出版时间:2019-11-22
/ 2

基于分布式电力资源库的搜索引擎框架

连阳阳吕鹏鹏方蓬勃于冰洋

(国网河北省电力有限公司信息通信分公司河北省石家庄市050022)

摘要:我国的电力事业也正在随着国民经济的不断发展,并为国民经济提供进一步发展所需的能源。但在其信息获取的过程中基本都采用的是通用形式的IE进行信息的搜集以及获取,但这一点与目前发展日趋成熟的互联网技术以及电力事业发展的全新要求完全不符。这对于我国电力事业长期健康发展而言是十分不利的,也正是因为这一点目前正在着力研究立足于分布式电力资源库之上的搜索引擎。本文就从其诞生的背景剖析出发,并在立足于分布式机制的基础上,提出了对应的搜索引擎框架。

关键词:分布式;电力资源库;搜索引擎框架

1、分布式电力资源库搜索引擎诞生的背景分析

在我国国民经济不断发展的前提下,我国的电力网络无论是在覆盖范围还是运行稳定性方面都有了长足的进步,并且经济发展所需要的电力资源也是逐渐不断扩大,再加之目前我国的互联网以及信息技术的发展也在日趋成熟,在这种情形下,继续依靠之前传统的通用性质搜索引擎来获取电力信息已经完全不符合时代发展的要求,传统信息获取方式获取到的信息中往往包含着一些垃圾信息、无用信息以及相关性极低的信息,这就造成了有效信息获取的难度提升以及绝大部分有用信息被封存。

基于这一点,国内也开始建立电力专业专属的搜索引擎系统,但采用的却是目录形式的搜索引擎架构,其效率与有关信息的获取依然没有明显的改善。在这多种原因的影响下,一种基于分布性质电力资源库的搜索引擎框架被提上了研究的日程中。这种性质的搜索引擎自身可以通过个性以及智能化的搜索服务将信息获取的准确性、全面性以及速度等等方面进行大幅度提升。

2、立足于分布式电力资源库的搜索引擎框架组成部分分析

2.1搜索引擎基本框架组成

目前研究的全新类型的搜索引擎所需的资源是完全由分布形式的电力资源库来提供的,采用的代理结构是分布移动形式的。这种方式将之前传统搜索引擎中的缺少智能化学习以及理解能力的缺点予以弥补。其基本框架组成如下:系统前端的搜索平台层主要是由浏览器以及WEB服务器共同组成,将所需查找信息的关键词在浏览器进行输入,随后借助于WEB服务器对数据库中的信息进行匹配,并将之结构再次通过浏览器反馈给用户。具体分层可以分为搜索平台层、电力搜索层以及底层三部分,在这三层下又可以再次细分为WEB服务器、电力资源库、用户库、相关资源库以及Agent平台这几部分。

在这类型的搜索引擎中使用的分布式机构具体可以划分为如下的几个层次:第一,搜索引擎中包含的每一个功能模块可以做到在不同主机上进行同步的协作。第二,多个此类型的搜索引擎可以实现信息之间的共享以及通信,其中所使用到的移动式Agent平台可以做到将其数据全部带到另外一台主机上进行接下来的工作流程,并且可以将最终的结构反馈到移动之前的主机上。正式因为这两点优势的存在,才可以真正意义上实现一个搜索引擎中的分布式网络的建立。

2.2Agent平台分析

在任何一个搜索引擎中都只能有一个的移动性质的Agent平台管理系统,同时也是不可或缺的关键部件之一,其主要的工作内容就是管理的注册、注销以及查询。同时也可以借助于其自身的通信性实现与其他搜索引擎的信息共享,并可以在整个搜索系统中某一部分功能负荷过大的同时,通过与该功能相关的Agent数量的增加来实现该部分功能的减负,因此这种搜索引擎自身的扩展性十分优良。

值得一提的就是在同一个Agent平台中只能拥有一个共享性质的Agent,但是其却可以实现在一个或者是多个的Agnet平台中的管理系统中进行注册,主要目的就是为了实现搜索引擎之间的彼此通信,在其获取的用户的查询内容以及其中的个性参数之外,就可以在其所属的平台将最大程度满足用户查询需求的共享性质Agent予以查询,并向其传输对应的用户查询命令以及其中的个性参数,最终由这个共享性质的Agent进行信息的查询工作并将之反馈到请求界面上。一旦在这个的Agnet平台经过搜索之后并没有发现对应的信息,就会将这个信息传达给其他的Agent平台进行新一轮的查询。

2.3搜索界面分析

搜索引擎库特点外在体现之一就是人机交互界面的,在这种类型的搜索引擎中其搜索界面的具体组成如下:第一,搜索需求的提交界面。通过对用户的搜索信息进行分析之后,将之分别提交到负责处理分词、短语或者是信息共享的Agent平台上。这里提交的搜索请求是将用户信息、请求输入之时的功能环境以及搜索请求的具体表达三部分包含在内的。第二,结果的显示界面。这个界面主要涉及到的就是前端页面的制作,在充分考虑用户观看习惯的基础上,将信息以一种全面合理的方式呈现到界面上。第三,引导界面,通过一个合理亲和的引导界面来帮助合理有效的查询到自身所需的信息。第四,分析搜索行为的界面。在跟踪并分析用户搜索行为的基础上,将其中的数据予以更新。

2.4智能化搜索机的分析

这种类型的搜索引擎之所以可以实现智能化以及个性化的结果搜索,最主要的原因就是智能化搜索机的实际应用。在该类型的搜索引擎中的Agnet平台在数据的挖掘方面是逐渐向着互联网形式的挖掘方向发展。,同时做到将之和灵活性以及实用性较高的检索技术予以灵活无缝的衔接,在对用户搜索行为不断进行跟踪的基础上,将其搜索行为中的规律予以挖掘并对今后的搜索行为进行一定程度的指导。在跟踪分析用户实际搜索行为的基础上,将其对于最终检索结果的期待进行挖掘,为其提供具备个性化特点的信息搜索服务。当其进行对应的文件搜索工作的时候,除了可以将与关键词密切相关的文件予以搜索之外,还可以做到将不予关键词直接诶关联,但却和整个的搜索主题完全相关的其他类型的文件,这种概念化的搜索可以借助于人工形式以及自动化学习或者是专家级别的标引来实现相关结果的一次性取出以及显示。

2.5跟踪评价部分的分析

这个跟踪评价部分的设置本质上就是为了进一步提升智能化搜索引擎的智能以及个性化程度。在领域、背景、知识体系等方面存在差异的用户自然也就在判断搜索结果对应相关性以及结果标准要求上存在着一定的差异。其中设置的跟踪评价部分在对用户针对搜索结果采取的后续行为进行跟踪以及评价的基础上,将用户经常性选择并予以大量时间花费的结果数据的权值予以增加,对于那些用户选择率较低并且基本不为其花费时间的结果的权值予以降低。并且将那些先添加到系统的资源由系统自身提供一个默认的权值,并根据用户对其的使用以及所花时间,来最终确定其权值。

3、总结

这种立足于分布式电力资源库基础上的分布式智能搜索引擎也正是未来电力事业自身搜索引擎的发展方向,并会在互联网、信息、人工智能技术等发展的支持下逐渐趋于完善,通过Agent、智能化搜索的应用、跟踪评价系统等等的实际应用将搜索引擎的效率以及智能化程度进行显著的提升。

参考文献

[1]刘雁行,米佳,韩雪,孔繁春.内蒙古电力营销数据智能搜索引擎[J].计算机与现代化,2019(07):78-81+110.

[2]杨丽萍,张希翔,孟椿智,谢瑞浩.基于Elasticsearch的大数据搜索引擎在电力企业的应用研究[J].数字技术与应用,2017(12):63+65.

[3]程昌宽.基于垂直搜索引擎和语义的Web服务发现的研究[D].华北电力大学(北京),2017.