中国联合网络通信有限公司黑龙江省分公司 黑龙江省 哈尔滨市 150001
摘要:随着信息科学技术的不断进步,为信息分析提供了更多的信息资源保障和技术支持,促使信息分析产生重大的革新。在此过程中信息分析也面临着前所未有的挑战。本文在阐述信息分析面临问题的基础上,提出了相应的解决对策。
关键词:信息分析;大数据;挑战;对策
在当前大数据快速发展的社会环境下,信息分析的根本目标始终没有改变,即针对特定的需求,对信息进行深度分析和加工,提供有用的信息和情报,为管理、决策等活动提供服务。但是在大数据的背景下,如何去实现大数据的存储、分析和应用则是摆在人们面前亟待解决的问题。
一、大数据时代信息分析存在的问题
大数据的快速发展,也伴随着大量的问题,通过对大数据环境下信息分析核心环节的梳理分析,总结出大数据时代信息分析中亟待解决的问题
(一)大数据时代信息分析思维有待革新
信息分析思维方式是人们进行信息分析思维活动所采取的方式,具体是指信息分析思维主体在一定理论、观念、方式和手段的基础上所形成的反映和把握信息分析对象的方法。信息分析人员的逻辑思维对信息分析工作的开展以及信息分析任务的完成都具有重要的作用和意义。在大数据时代背景下,大数据是人们获得新的认知、创造新的价值的源泉,大数据还是改变市场、组织机构以及政府与公民关系的方法。大数据环境对信息分析人员的工作模式和业务内容都带来了巨大的改变,如何适应新的信息技术环境和数据科学范式是大数据时代信息分析工作人员亟待解决的问题。因此,情报分析人员在着手新的信息分析任务或课题前,首先必须以全新的思维方式为起点。信息分析呼唤大数据思维。
(二)信息分析资源保障体系有待完善
随着时间和信息技术条件的改变,情报资源体系经历着一个动态变化的过程,但是,在一定时间范围内,情报分析人员要想完成高水平的信息分析任务或课题研究,必须尽可能多地搜集不同信息来源的情报分析资源,而在大数据环境下,不同来源的数据必须经计算机系统实现集成与资源整合后才能更好地为情报分析人员所用。多源数据集成与信息资源整合的概念在国内出现较早,1995 年有文献提出了多源数据库的集成,后在地理、遥感测绘等领域普遍应用。2001 年,情报分析领域探讨了学术信息资源整合体系的问题。信息资源整合与信息资源保障体系构建是情报分析任务完成的重要条件保障。但从实际来看,情报研究机构在大数据环境下对情报资源的整合利用还不够,还没有构建出能够快速满足情报分析任务的资源保障体系。
(三)信息分析方法亟待创新
信息分析方法是创新信息分析工作的核心和信息
分析学科发展的不竭动力。以往的信息分析实践,更多地关注于文献分析,回顾信息分析的方法主要有以内容分析法、引文分析、共现分析法以及网络链接分析法为主的科学计量分析,以因子分析、聚类分析、回归分析、时间序列分析为主的统计分析方法,以数据仓库、OLAP、数据挖掘为主的计算机辅助分析方法等。卢小宾和郭亚军对信息分析方法进行了系统总结,将信息分析的方法体系划分为信息分析的哲学方法、基础方法、一般方法和特殊方法四大类。在大数据时代,这些信息分析方法本身没有问题,但它们已经不能适应大数据环境下多源数据融合、社会网络结构分析、空间信息分析、可视化分析、大数据批量分析与流式分析的需要。大数据时代,信息分析工作从根本上需要信息分析方法创新。
(四)信息分析工具亟待开发
随着信息技术的发展及其在信息分析工作中的广泛应用,信息分析工具的软件化与系统化使得信息分析工作效率得到了巨大提高。然而,大数据环境下专业信息分析软件工具的缺乏成为当前信息分析领域亟待解决的重要问题之一。大数据时代信息分析的难点不在其数据量之大,而在于对海量、复杂、非结构化数据的分析,不借助于专业的分析工具很难在规定的时间内完成分析任务,或者很难在较短的时间范围内更多地发现大数据里潜藏着的情报价值。
二、大数据时代信息分析的对策
针对大数据时代信息分析过程中存在的 4 个方面的挑战和 5 个方面的问题,本文提出了以下对策建议。
(一)培养大数据思维
信息分析思维包括信息分析思维主体、客体和工具,具体是指信息分析人员、信息分析任务或课题、信息分析工具与技术。在大数据时代,信息分析客体和技术工具的变化,使得信息分析主体只有主动适应客体和技术工具的变化,才能更好地胜任信息分析任务或课题研究。而且,信息分析思维与客体和技术工具本身具有相互融合、相互促进的作用,在信息分析主体认知客体和使用技术工具的同时,信息分析客体和技术工具环境反过来作用于信息分析主体,已有研究表明,信息挖掘技术、海量信息处理技术、大数据技术、云计算技术等新的信息技术手段的出现,又都从不同侧面提高了信息分析思维能力。此外,大数据环境下信息分析任务或课题研究实践,也是培养大数据思维的有效手段。
(二)构建大数据环境下的信息资源保障体系
信息资源保障体系应该是系统化、综合化的资源体系和管理体系,尤其是在新一代信息技术环境和大数据背景下,本文提出在国家层面的宏观信息资源保障体系下,构建基于专题和产业的信息资源保障体系。在这方面已经有一些理论成果,如有关我国生物医学信息资源保障体系建设的战略构想和战略性新兴产业信息资源保障体系建设的探讨等。对于情报研究机构而言,构建基于专题和产业的信息资源保障体系具有重要的意义,尤其是在大数据环境下,将多源数据充分地进行集成,将各种类型的信息资源进行有效整合,可形成信息资源建设与情报研究的良性互动。
(三)创新大数据环境下的信息分析方法
从大数据发展的实践来看,信息分析任务最大的变化是突出实时数据、动态数据和关联数据的分析和应用。从信息分析对象的类型来看,则包括文本、图像、视频、音频等多媒体信息。从信息分析对象来源来看,则包括互联网大数据、物联网大数据和科学研究大数据等。以往的基于小数据的信息分析方法已经不能适应大数据时代信息分析任务的需要,单独用情报学的研究方法、统计学的方法或是计算机科学的方法也不能处理大数据环境下的情报分析课题。在当前云计算和大数据快速发展的背景下,基于云计算的技术和方法,开展大数据分析处理是摆在信息分析人员面前的最佳选择方案,如 Mapreduce 是一种简洁的并行计算模型,它在系统层面解决了扩展性、容错性等问题,通过接受用户编写的函数,自动地在可伸缩的大规模集群上并行执行,从而可以处理和分析大规模的数据。
(四)研发大数据环境下的信息分析工具
具体来看,专业化的大数据分析工具应该具有强大的数据仓库支持,把海量的结构化数据和非结构化数据用并行数据库和分布式文件系统分别进行存储;然后用数据可用性的 5 个方面的标准去衡量搜集的原始数据的数据质量,将基于弱可用的数据分析方法整合进信息分析工具的功能之中,实现对弱可用数据的清洗和预处理;进而调用大数据分析工具的分析模型对新产生的数据进行分析处理,找出数据中暗藏的情报信号或已有重大问题的相关影响因素等,帮助人们实现及时处理大数据的目标。
三、结语
大数据时代已经来临,社会各行各业都面临着前所未有的数据量和数据分析需求。本文只是对大数据领域已经存在的主要问题进行了梳理,由于数据产生方式的多样性和数据的动态演变,大数据时代信息分析的方法和技术也会随之变化,只有紧跟,大数据发展的理论前沿和实践需要,运用大数据思维才能科学地把握大数据发展的走势,才能有效地架构和驾驭大数据时代的信息分析。
参考文献:
[1]李佳佳.基于开放数据和云计算的商业信息分析模式构建[J].图书情报工作网刊,2018(6):17 -22.
[2]罗爱静,向英明.信息资源保障体系建设的哲学基础[J].情报探索,2017(8):3 -4.