随着大数据时代的来临,在科学研究、社交网络、数据管理等应用领域,图书馆知识服务及信息化建设现状,电脑化管理可帮助图书馆建立各类知识服务及业务建设等,同时也带来许多问题。
结合现阶段信息技术的发展状况及信息资源的利用需求,如何正视大数据给当前图书馆各个方面带来的冲击主挑战,也是理解什么是“大数据”,所必须掌握的内容:
一、数据量增长所带来的存储能力及计算能力的挑战。在飞速发展的数字信息环境中,数据成本下降促使数据量急剧增长,新的数据源和数据采集技术的出现使数据类型增多,各种非结构化的数据又增加了大数据的复杂性,但从大数据应用中却可以发现具有极强挑战性的科学问题用社会问题,而这有助于推动以大数据为基础的科学研究第四范式,促进图书馆形成新型知识服务范式,而现有数据中心技术难以满足大数据的应用及知识服务需求,整个知识服务架构的革命性完善势在必行。首先,存储能力的增长远远落后于数据量的增长,设计最合理的分层、分级存储架构已成为信息资源管理及知识服务体系的关键;其次,移动互联网技术的完善,使得数据移动较之以往更为频繁,而数据的移动亦变成为信息资源管理最大的开销,这就促使知识管理从传统数据围绕着计算能力转,转变为计算能力围绕着数据转;第三,高通量计算机、高可靠性、高可扩展性、高可用性的规模、语义、统计及预测性等数据分析技术、新的数据表示方法等都是丞待解决的技术问题。
二、由传统常规分析向广州度、深度分析所带来的挑战。数据分析成为图书馆知识服务体系创新与完善必不可少的支撑点。图书馆不仅需要通过数据了解现在知识服务过程发生了什么,更需要利用数据对科研创新合作过程及合作交互型知识服务过程将要发生什么进行分析和预测,以便应对图书馆未来所面对的生存危机,在行动上做出一些主动准备。值得补充的是,这些分析操作除了包括数据关联关系分析、时间序列分析、大规模图分析、社会网络分析及移动平均线分析等广度及深度分析,还包括常规分析。
三、基础设施挑战。数据量及非结构化数据的迅速增加,使得存储及计算规模不得不随之增大,导致其成本急剧上升,处于成本的考虑,越来越多的知识服务机构将应用由高端服务器转向中低端硬件构成的大规模计算机集群,从而对支持非结构化数据存储及分析的基础设施提出 了很高要求。第一,需要将存储、计算需求分布到为大规模分布式数据密集型应用而设计的基础设施中;第二,需要拥有以济高效的存储与计算能力,足以获取、存储和分析高级别的数据,并拥有足有的智能分析能力来减少数据足迹;第三,需要拥有可快速将分块的大数据集复制到网络基础设施;第四,需要拥有保护高度分布式基础设施和数据的可信应用体系的软硬件基础设施;第五,作为人力及智力基础设施,技能熟练的图书馆员也是图书馆大数据研究及处理最值得期待的挑战之一。