您好,欢迎来到爱go旅游网。
搜索
您的当前位置:首页浅析大数据带给图书馆的影响与挑战

浅析大数据带给图书馆的影响与挑战

来源:爱go旅游网
农业图= 情报学刊:工作研究 第26替 价值,在这种形势下,咨询公司、政府机构、企业等 纷纷抛出了“大数据”这个概念: 维基百科对大数据的定义则简单明了:大数据是 指利用常用软件工具捕获、管理和处理数据所耗时间 超过可容忍时间的数据集 。 百度百科中指出:大数据(big data),是指目前主 流软件工具无法处理的规模巨大的能帮助企业提出经 营决策的资讯【 。 有学者指出“大数据是指一般的软件工具难以捕 捉、存储、管理和分析大小已经超出了传统意义上的 数据[61。 虽然大数据的定义很多,但业界达成一个共识. 即:大数据不仅是包括规模庞大、多种类型的数据集, 还包括对数据集进行的收集、处理、分析以及提取价 值的快速信息获取。 1.2大数据特征 随着对大数据研究的不断深化,总结出大数据的 特征即“4V+IC”,共5项显著特点: (1)速度(Velocity)快:数据在特定的时间和空 间中生成,同时按照需要和要求提供实时、交互式的 的数据分析。 (2)大容量(Volume):数据量的数据规模和信息 流量非常庞大,已达到PB级甚至是ZB级,并且每两 年翻一番 (3)类型繁多(Variety):非结构、半结构化、结 构化数据并存,数据的类型多种多样;对现有的数据 管理流程、计算机处理能力都提出了更高的挑战。 (4)价值稀疏性(Value):将大数据的各种类型数 据进行整合、分析后,会开发出有巨大价值的信息业 务,但有价值的数据在数量庞大的数据中所占比例极小。 (5)复杂性(Complexity):数据管理和数据分析 非常复杂,大数据处理不适用于在数据库中持久存储 的数据,需要用新的技术能将异构数据进行统一接人 并及时的对数据进行分析处理闭。 大数据这些特性说明了大数据隐含的深刻理念, 具体如下:①大数据的深层次挖掘、分析是大数据时 代图书馆开展的核心业务。②数据的形态繁杂多样且 极具开发价值。③数据的融合、分析处理将形成新的 产业。大数据的这些特性与暗藏的理念预示着现有 的IT架构将随着大数据时代的来临而出现改变,图书 馆也将在数据对象、数据处理、应用技术等方面迎接 挑战,产生巨变。 1.3大数据的由来及其应用 “根据IDC监测,2013年,我们只需10分钟生成 的数据量相当于2011年全年数据量的规模,到2020 年产生的数据量将是2010年所产生数据量的30倍。 每两年全球数据量大约翻一番,预计到2020年,全球 的数据量将达到35ZB。规模庞大的大数据的来源是各 种电子资源(多媒体资源.电子书刊等)的积累,是 移动图书馆及智能手机的普及,是数据仓库与数据挖 掘、语义网、云计算、社交网络、物联网等新技术发 展的自然延伸,是互联网带宽发展、CPU处理能力、 存储器价格等因素综合作用的结果。可以说,没有海 量数据的不断泛滥就不可能出现大数据技术。大数据 技术将是IT界新一代的技术指引,它将引导人们从海 量、繁杂的数据中提取有价值的信息”可以通过了解 商业客户的消费数据,从而对市场发展的趋势进行预 测等,从而给数据分析、数据挖掘等产业带来了无限 的商机。大数据改变了业界、公司的经营运行方式. 一个致力于收集、存储、分析大数据的行业已形成。 从对市场的如何开发到如何挖掘有利的经营信息.在 任意大的数据组中应用统计分析方法就可从中发现有 利用价值的信息。将这些有价值的信息商业化即可 从中获得利润。据有关调查在过去的五年时间里. 有10%的公司认为大数据技术彻底改变了企业的经营 方式和经营理念。46%的公司认同其企业决策的一项重 要技术支持来自于大数据技术。 2大数据时代图书馆面临的影响与挑战 随着大数据时代的来临,信息业正逐渐把数据作 为其最重视的资源之一,企业的决策行为将逐渐在进 行数据分析的基础上得出,信息高速发展的时代使得 图书馆具备大数据的特征,科技创新、科学研究和学 科知识服务将越来越依赖于大数据的挖掘与分析,大 数据时代图书馆的发展将面临着全新的机遇和挑战。 2.1图书馆的存储能力面临巨大挑战 在高速发展的信息社会,随着数据成本的下降, 多样化的信息产生方式正在使数据信息量以超乎人 们的想象的速度在增长,如今在美国,企业规模超 过1 000人的企业中,大约有超过94.6%的企业其数据 储存量已突破100TB:淘宝每日的活跃数据量已经超 越50TB:百度每日新增数据量为10TB.每天系统处 理数据量为1PBtS ̄,我们的丁作和生活也正在被与日俱 增的数字化影响着,无论是在图书馆学习,或是上班 打卡、娱乐或休闲,都可以被量化成二进制的数据信 息,使海量的半结构化、非结构化信息数据被不断产 生,信息数据的类型、形态、结构等都愈加复杂,使 社会对图书馆的数据存储、数据服务等方面提出了更 硝11期 刘乐乐:浅析大数据带给图书馆的影响与挑战 高的要求。传统数据库的存储能力还不能达到存储达 到90%比例的非结构化数据,这些复杂的数据的存储、 管理将对图书馆的存储能力存在巨大的挑战性,而现 阶段图书馆数据中心技术远远不能满足大数据的实际 应用与知识服务需求的能力,传统的数据库处理技术 还不能处理多种类型的数TB级别的数据,也不能充分 开展高层次的数据分析。图书馆数据存储能力的不足, 将导致许多信息咨询服务和数字资源服务无法向读者 开展使用。因此,要想提高图书馆的数据存储能力, 必须完善图书馆的信息技术和数据库处理技术。其次, 随着信息技术的不断发展,而频繁的数据移动将大幅 度提高信息资源管理成本的花费,这就导致了知识管 理方式发生改变,即从传统的以计算能力为核心,转 变为以数据为核心,计算能力围绕着数据转的管理方 式。如何去解决大数据对存储能力的高要求与图书馆 对海量数据存储的实际能力之间的矛盾,将是影响大 数据时代图书馆发展的重要因素。 2.2数据分析的挑战 随着社会信息化程度的El益提高,使得以互联网 信息搜索、信息查询为基础服务内容的图书馆把信息 服务.数据服务作为现阶段图书馆服务发展的主要内 容之一。但不管是传统的信息服务还是结合了数据分 析的新型服务,仅仅是针对结构化数据而进行的服务。 大数据时代的数据类型增多,包括结构化数据,半结 构化数据和非结构化数据。并且,数据增长速率非常 快(结构化数据的增长速率为32%,非结构化数据的 增长速率为63%) ,传统的数据挖掘算法只是针对于 结构化的数据进行分析处理,没有能力处理其他类型 的数据,通常是先将其他类型数据转换为结构化数据, 然后再进行挖掘和分析。这种数据分析的方法存在的 不足,一是延长了数据分析的时间,降低了实时工作 效率,二是不能完全彻底的挖掘非结构化数据隐含的 价值,影响了数据分析的准确性和客观性,存在一定 的误差。尽管图书馆的信息化服务有了显著提高.但 有一定的局限性,图书馆也仅仅是围绕用户的结构化 数据,去完成限定范围的差异服务。比如从图书馆读 者使用的网络中就可能找出读者的需求趋势,以便图 书馆找到更好的服务读者的方式。因此在这种背景下 要想推动图书馆知识服务体系创新就必须将数据分析 作为其发展的重中之重。大数据不仅可以使图书馆通 过结构化数据掌握图书馆服务、运行的现状.也可以 通过非结构化数据、半结构化数据去分析、挖掘和预 测将来会发生什么,使图书馆可以应对未知的生存危 机及挑战。因此在大数据时代,馆藏资源、建筑空间、 服务水平不再是衡量图书馆间竞争的标准,而对大数 据的拥有量及对各种不同类型、海量数据的分析、开 发将成为大数据时代图书馆竞争力的主要体现。大数 据的分析与预测将决定图书馆的建设、发展策略。 2.3图书馆数据隐私安全保护问题的挑战 伴随着计算机的出现使得大量的数据以数字化的 形式被存储,大数据包含了大量的个人隐私信息,互 联网的发展则加速了数据的产生和传播,怎样能有效 保护读者的数据隐私,防止这些信息被外泄,这将对 图书馆能否有效地保护读者隐私、维护用户的权益提 出了挑战。 (1)隐性的数据暴露。随着互联网、社交网络在 人们的生活中出现的频率的增高,使得人们在不同的 地点产生数据足迹都可能被计算机记载下来,因为数 据具有关联性和累积性,如果将某个人从不同的独立 地点留下的数据足迹收集在一起时,就很有可能会暴 露其隐私,用户的数据安全性受到了威胁。大数据时 代信息传播的速度快、范围广,用户的核心数据信息 能被微博等社交网络在任意时间里以最快的速度的发 布到任何角落,在短时间内就可把用户的数据信息曝 光,这种隐性数据的暴露往往具有不可掌控性和不可 预知性。因此,大数据时代的数据隐私安全保护面临 着人力和技术层面的双重挑战. (2)隐私保护与数据公开的矛盾。如果只是单方 面为了保护隐私而隐藏所有的数据,那么数据的价值 就得不到体现,因此,数据公开是非常有意义和必要 的。企业为了压低成本,通常会把信息和数据存储在 云端,政府通过检查云端中所存储的数据来了解整个 国民经济社会的实际运行情况,从而制定出适合国情 的国家发展政策:企业通过利用公开的数据了解客户 的消费行为,从而根据消费者的消费心理推出满足消 费者需求的产品和服务:研究者通过公开的数据。可 以借鉴不同国家的社会、经济、技术等领域来开展学 术研究.图书馆可以通过用户的数据信息分析读者的阅 读习惯、阅读喜好,从而提供更贴近读者需求的服务。 因此,大数据时代的数据安全保护主要体现在既 不暴露用户具有隐私性的敏感信息,又能开展和进行 有效的数据挖掘、分析,因此对于图书馆的工作者而 言,知晓读者的详细数据信息,而又严格保守用户的 数据安全,维护好用户的个人权益,这就对新时代的 图书馆员的专业素养和职业道德提出了更高层次的要 求和挑战 2.4图书馆大数据专业人才紧缺的挑战 数据中蕴含着有待开发的巨大的价值,但需要有 农业图}5情报学刊: 作研究 筇26卷 专业的人才来操作高科技化的大数据平台才能充分的 分析和挖掘大数据,才能从大量的数据中挖掘出具有 价值的信息。由于大数据技术是新兴技术,并且需要 从业者是拥有多个学科的综合知识积累的高素质人才. 因而操作大数据平台的大数据人才也是关系到大数据 技术能否顺利普及并发展的重要条件。据麦肯锡调查 预测,在未来六年内,仅在美国就面临缺少大约150 万名能够操作大数据平台㈣、能进行数据分析和管理的 专业人才。大数据人才的缺失,影响了大数据的分析 和开发,延缓了大数据技术的发展。图书馆在数据分 析方面人才紧缺的现状是.在面对具有可开发价值的 数据时,图书馆及工作人员缺少主动开发数据资源的 职业意识。及能够管理和分析其所拥有的各种半结构 化、非结构化和结构化数据的技术和能力。因此,培 养接受过专业培训的大数据专业人才将是解决大数据 时代图书馆人才紧缺的当务之急。 3结束语 随着云计算、互联网技术的发展,数据量快速的 增长。大数据的时代已经到来,大数据的正确利用将 会给人们的生活带来翻天覆地的变化,但同时也使传 统的数据管理方式面临极大的挑战和冲击。图书馆已 经具备了大数据的特征,大数据时代将给图书馆的图 书情报服务带来机遇和挑战,广大图书馆工作者在未 来发展过程中必须要面对这些机遇和挑战,只有那些 能够运用大数据技术处理新数据型态的图书馆,才能 在竞争激烈的图书馆服务中不被淘汰,处于可持续的 竞争优势。相信随着大数据研究的不断深入.图书馆 对大数据的充分挖掘和利用,会使图书馆的服务更加 完善以满足读者的知识服务需求。 参考文献: [1】The New York Times.The Age of Big Data[EB/OE1.【20l2-05—231 htt0..//www.nytimes.corn/2012/02/12/sun-day—review/big—data—ira- pact—in—the一-worldhtm?page—wanted=al1. I2]The Wall Street Journa1.Big-Data Success StoriesSplunk 1[EB/OL]. [2012一-07—19].http://blogs.wsj,eom/ventureeapital/2011/10/21/big—da— ta—saecess-一-stories-splunk/. 【3】中国社会科学院文献情报中心.社会科学新词典【M】.重庆:重庆出版 社,1988:1213—1214. [4]Big data[EB/O LJ.[2012-10-02].http..//en.wikipedia.Org/wikimig_data. [5]http://zhidao.baidu.corn/link?url=e7LuFgIUOSo199kMX0gmzBu146DX —cEkbNPAh9BBzwVdpB ̄r9j4.一-IdsnQqiRFZdBlrC一15ZqB]P—』nbwXtQz va6q. [6]徐子沛 大数据:正在到来的数据革命,以及它如何改变政府、商业与 我们的生活 】.桂林:广西师范大学出版社.,2012:40-一57. 【7]互联网.大数据时代的特点【EB/OL].,[2012-11—14].http://www.5ban. cn/html/2012/xueshu0417/32237.htm1. 一【8]曹菲菲.基于内容分析的专利挖掘技术研究【D],沈阳:东北大学, 2008:l2. 【9J高继平,丁垫.专利研究文献的可视化分析田.情报杂志,2OO9,28(7): 12—16. [10】大数据时代人才需求,你能符合要求吗?[EB/0 L].[201 2-08-5].http: //tech.htexun .com/2012-0 】一1 6/l 372964 8.1 html. 

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- igat.cn 版权所有

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务