本期关注 两化融合 大数据与云计算在医疗行业的应用 胡悦/浙江经济职业技术学院 摘要:大数据这个概念在现今社会被大量提及,经常和云计算一起提及 医疗行业具有数据量大、复杂性高等特点。 大数据研究方法很多时候都要跟云计算结合在一起。在医疗行业应用大数据和云计算,必能够解决很多医疗难题。 关键词:大数据;医疗行业;云计算 /匠 疗行业可能是让大数据分析最先发扬光大的 传统行业之一。医疗行业早就遇到了海量数 据着眼于“数据”,关注实际业务,提供数据采集分析挖掘, 据和非结构化数据的挑战,而近年来很多国 家都在积极推进医疗信息化发展,这使得很多医疗机构有 资金来做大数据分析。因此,医疗行业将和银行、电信、 保险等行业一起首先迈入大数据时代。麦肯锡在其报告中 指出,排除障碍,大数据分析可以帮助美国的医疗服 务业…年创造3000亿美元的附加价值。 基于疗效的研究包括比较效果研究(Comparative Effectiveness Research,CER)。研究表明,对同一病人来 说,医疗服务提供方不同,医疗护理方法和效果不同,成 (1)从整体上看,大数据与云计算是相辅相成的。大数 看重的是信息积淀,即数据存储能力。云计算着眼于“计 算”,关注IT解决方案,提供IT基础架构,看重的是计算能 力,即数据处理能力。没有大数据的信息积淀,则云计算的 计算能力再强大,也难以找到用武之地;没有云计算的处理 能力,则大数据的信息积淀再丰富,也终究只是镜花水月。 (2)从技术上看,大数据根植于云计算。云计算 关键技术中的海量数据存储技术、海量数据管理技术、 MapReduce编程模型,都是大数据技术的基础。 (3)大数据的商业模式与架构…一云计算及其分布式结 本上也存在着很大的差异。精准分析包括病人体征数据、 费用数据和疗效数据在内的大型数据集,可以帮助医生确 构是重要途径。大数据处理技术正在改变目前计算机的运行 模式,正在改变着这个世界。它能处理几乎各种类型的海量 定临床上最有效和最具有成本效益的治疗方法。医疗护理 系统实现CER,将有可能减少过度治疗(比如避免那些副 作用比疗效明显的治疗方式),以及治疗不足。从长远来 看,不管是过度治疗还是治疗不足都将给病人身体带来负 面影响,以及产生更高的医疗费用。 1工作原理 数据,无论是微博、文章、电子邮件、文档、音频、视频, 还是其它形态的数据。它工作的速度非常快速,实际上JL乎 实时。它具有普及性,因为它所用的都是最普通低成本的 硬件,而云计算将计算任务分布在大量计算机构成的资源池 上,使用户能够按需获取计算力、存储空间和信息服务。云 计算及其技术给了人们廉价获取巨量计算和存储的能力,云 计算分布式架构能够很好地支持大数据存储和处理需求。这 样的低成本硬件+低成本软件+低成本运维,更加经济和实 用,使得大数据处理和利用成为可能。 3实施步骤理论分析 数据采集部分:ETL工具将利用分布的、异构数据 源中的数据进行清洗、转换集成。可以通过医院检查或 者通过社区APP采集病人的资料。将数据最终加载到数 据仓库中,成为联机分析处理、数据挖掘的基础。数据 存储、基础架构:数据可以存放在关系型数据库中、 NoSQL中,基础架构使用云存储或者分布式文件方式 存放。数据的分析处理:自然语言处理(NLP,Natural 大数据:大数据技术(big data),或称巨量资料, 指的是所涉及的资料量规模巨大到无法通过目前主流软 件工具,在合理时间内达到撷取、管理、处理、并整理 成为帮助企业经营决策更积极目的的资讯。 (在维克托・ 迈尔.舍恩伯格及肯尼斯・库克耶编写的《大数据时代》 中大数据指不用随机分析法(抽样调查)这样的捷径, 而采用所有数据的方法)大数据的4v特点:Volume(大 量)、Velocity(高速)、Variety(多样)、Veracity(真 实)。云计算:是一种按使用量付费的模式,这种模式 提供可用的、便捷的、按需的网络访问,进入可配置的 计算资源共享池(资源包括网络,服务器,存储,应用 软件,服务),这些资源能够被快速提供,只需投入很 少的管理工作,或与服务供应商进行很少的交互。 2大数据与云计算的联系 医疗行业存在多种传感器系统,针对病人在每秒钟可 Language Processing)是研究人与计算机交互的语言问 题的一门学科。处理自然语言的关键是要让计算机“理 解”自然语言,所以自然语言处理又叫做自然语言理解 (NLU,NaturalLanguage Understanding),也称为 以产生5000多条数据,如何对这些数据进行组织和分析成 为现今医疗行业的难点。有了大数据的分析方式可以改变 现今的医疗方式,比方说可以改变现在的成人用药每天3 次每次一片,变更为根据体内血液中成分的含量动态提醒 你是否该用药了。 ●卜—————————一 中图分类号:TP 399-C8 算语言学(Computational Linguistics。一方面它是语言 信息处理的一个分支,另一方面它是人工智能(AI, Artificial Intelligence)的核心课题之一。统计分析:利 用logistic回归分析方法对数据进行统计分析。logistic回 归主要用于危险因素探索。因变量Y为二分类或多分类变 下转第145页》》》》》》 1 43 I CD Software and Applications 本期关注 两化融合 层由具有IT技术实施能力的信息化:[作人员组成,丰要职 3-4建立和完善各项规章制度、优化工作流程。建立 机房、网络、网站、自动化设备、软件系统、信息安全、 信息化运维、项目开发、信息化人才培养等一系列规章制 能为执行落实决策层的重要决定,完成管理层下达的信息 化工作指令,承担中心信息化具体T作。 3.7加强信息化人才队伍建设。利用现代化的培训手 段,注重知识更新,根据信息技术的发展进行人才队伍的培 训,分阶段、分层次、分类别地开展岗位培训、提高培训、 继续教育培训和拓展培训,普及信息化专业知识,提高中心 职工信息化知识的整体水平。 3.8探索信息服务体系。为加快知识产权信息传播, 全面推动专利信息服务于社会的工作,促进地方知识产权 事业的长远发展,以《全国专利信息公共服务体系建设规 划》为指导,统盘规划、精心组织、充分调研,以中心对 度,做到广泛宣传、严格落实,确保信息化工作的有效 开展和信息化项目的成功实施;制定紧急预案,明确责任 人,确保在突发事件出现时,在最短时间内恢复中心信息 系统的使用。 3.5全面构建信息安全体系。通过安全管理和技术手段 保护中心信息系统的硬件、软件、网站以及所有数据,使 之不因为偶然或者恶意侵犯而遭受破坏、更改及泄露;进 行全面的安全管理,完善人员管理、制度管理和安全策略 规范;定期对信息化工作人员进行信息安全技能培训,在 全中心范围内开展信息安全宣传和教育活动,从整体上提 高中心信息安全事故防范能力和员工信息安全责任意识。 3.6组建层次化的信息化管理架构。从宏观上将信息 化管理队伍的组织结构划分为决策层、管理层和执行层三 个层面,决策层由中心领导组成,主要职能为对中心信息 化工作做出指导性的决策;管理层由办公室领导及信息 化室管理人员组成,主要职责为组织实施决策层的重要决 定,提出中心信息化建设中长期规划和年度计划方案,组 织和协调实施,管理信息化设备和项目,负责信息安全工 作,参与知识产权信息化工作的局内合作与交流等;执行 参考文献: 外服务的需求为导向,探索面向湖北及周边省份公众的、 具有地方特色的专利信息服务体系。 4结束语 京外审查协作中心的建立与发展既能实现全国专利审 查队伍的壮大和专利审查能力的提升,也能够推动地方专 利事业和地方经济的发展。信息化建设作为京外审查协作 中心的基础保障,其重要性是不言而喻的,鉴于当前京外 审查协作中心信息化建设的现状,本文所提出的信息化发 展规划具有一定的借鉴意义,有助于京外审查协作中心的 健康合理发展。 [1】刘芳芳.用信息科学发展观推进规划信息化建设….信息技术与信息化,2007(05). [2】谭俊峰,龙剑.集团企业信息化规划中的风险和对策….计算机光盘软件与应用,2012(O8):3—4. 作者单位:国家知识产权局专利局专利审查协作湖北中心,武汉《《《《《《上接第143页 量,自变量既可以为分类变量,也可以为连续变量。比 的人力资源的消耗,又节省了病人排队等待的时间,更加 430000 如,探索胃癌发生的危险因素,胃癌作为因变量,分为 两类,“是”或“否”。危险因素可以有一个多多个, 比如性别、年龄、幽门螺杆菌感染等。通过logistic回归 就可以发现哪些因素会影响胃癌的发生。 及时的解决了病人的问题。 除了以上应用外,春雨医生还可以根据病人的描述, 通过匹配海量数据可以为病人量身定做一套保健方案,用 以改变病人的不良作息。 4应用领域实践分析 大数据在实际中的应用产生了像春雨医生这样的医疗 社区软件。春雨医生APP ̄IJ用手机端采集病人的局部的病 痛的照片,结合手机的传感器采集到病人的脉搏等信息, 这些基础数据的采集随着时间的推移将构成海量数据。 医生对于病人的诊断的结果,也会保存在数据库中, 这样同样类型的病症在治疗时就不需要每次都是找医生来 诊断。春雨医生可以根据病人的病症信息结合同类病症医 生的诊疗结果,可以给病人提出建议,这样既节省了医生 参考文献: 以上功能的实现都离不开大数据的收集、分析与处 理,而处理海量数据单靠一台服务器是很难完成的,我们 需要借助云计算机来实现,数据的共享、CPU的共享。 5结束语 现今计算机的应用已经不仅局限于某一‘个领域,在物 流网、医疗、通信等行业都有广泛的应用。大数据技术和 云计算技术成为计算机领域的热门话题,正逐步应用在生 活的各个领域。本文通过简单的描述说明了在医疗行业, 大数据和云计算是如何应用的。 [1]孟小峰,慈祥.大数据管理:概念、技术与挑战[J】.计算机学报,2 O1 3(08). [2]关志刚.信息图:大数据企业生态图谱[J/0L].IT经理网.httD://www.Ctoci0.com/bigdata/7028.htm [3]李国杰.大数据研究的科学价值[J].中国计算机学会通讯,201 2(09):8-1 5. [4]王珊,王会举,覃雄派.架构大数据:挑战、现状与展望[J】.计算机学报,2011(1 0):1 741—1 752. [5]W.Ecker son.TDWI Check1 i St Report:Big Oata Ana1ytiC S[J】.TDWI Re Search,201 0. [6】E.Brewer.CAP Twe1ve Years Later:How the”Ru1es”Have Chan.ged[J】.COMPUTER,201 2(02):2 3-29 作者单位:浙江经济职业技术学院,杭州 31 001 1 45 l CD Software and Applications