Vol. 33, No. 10 2019年10月
JOURNAL OF CHINESE INFORMATION PROCESSINGOct., 2019
文章编号:1003-0077(2019)10-0001-07
中文医学知识图谱CMeKG构建初探
奥德玛K2,杨云飞K2,穗志方K2,代达劢〃,常宝宝“2,李素建K2,昝红英2,3
(1.北京大学计算语言学教育部重点实验室,北京100871;
2.鹏城实验室,广东深圳518055;3.郑州大学信息工程学院,河南郑州450001)
摘要:医学知识图谱是智慧医疗应用的基石,可以为机器阅读理解医学文本、智能咨询、智能诊断提供知识基础。 现有的医学知识图谱从规模化、规范化、体系性、形式化等方面还不足以满足智慧医疗应用的需求。此外,对复杂 医学知识的精准描述更是构建医学知识图谱面临的重要挑战。针对上述问题,该文利用自然语言处理与文本挖掘 技术,以人机结合的方式研发了中文医学知识图谱第一版CMeKG 1. 0 (Chinese Medical Knowledge Graph)。
CMeKG 1.0的构建参考了 IOMO、A丁C、MeSH等权威的国际医学标准术语集以及规模庞大、多源异构的临床路
径指南、临床实践、医学百科等资源,覆盖了疾病、药物和诊疗技术,包括100余万个医学概念关系的实例。该文综 述了 CMeKG 1.0构建过程中的描述体系、关键技术、构建流程以及医学知识描述等相关问题,希望为医学领域知 识图谱的构建与应用提供一些参考。
关键词:知识图谱;智慧医疗;知识描述体系;知识提取 中图分类号:TP391
文献标识码:A
Preliminary Study on the Construction of Chinese Medical Knowledge Graph
BYAMBASUREN Odmaa1,2,YANG Yunfei1,2,SUI Zhifang1,2,DAI Damai1,2
,
*
CHANG Baobao1,2,LI Snjian1.2,ZAN Hongying2.3
(1. Key Laboratory of Computational Linguistics, Ministry of Education,
Peking University, Beijing 100871, China;
2. Peng Cheng Laboratory, Shenzhen, Guangdong 518055, China;
3. School of Information Engineering, Zhengzhou University, Zhengzhou, Henan 450001, China)
Abstract: The medical knowledge graph is the cornerstone of intelligent medical applications. The existing medical knowledge graphs are not enough from the perspectives of scale, specification, taxonomy,formalization as well as the precise description of the knowledge to meet the needs of intelligent medical applications. We apply natural language processing and text mining techniquevS with a semi-automated approach to develop the Chinese Medical Knowledge Graph (CMeKG 1.0). The construction of CMeKG 1. 0 refers to the international medical coding systems such as ICD-10, ATC, and MeSH ♦ as well as large-scale» multi-source heterogeneous clinical guidelines» medical stand- ardvS, diagnostic protocols, and medical encyclopedia resources. CMeKG covers types such as diseases, drugs, and diagnosis/treatment technologies, with more than 1 million medical concept relationships. This paper presents the description system, key technologies, construction process and medical knowledge description of CMeKG 1.0, serving as a reference for the construction and application of knowledge graphs in the medical field.
Keywords: knowledge graph; intelligent medical treatment; knowledge description system; knowledge extraction
收稿日期:2019-04-15 定稿日期:2019-06-17
基金项目:国家重点研发计划(2017YFB1002101);国家自然科学基金(61772040,61751201)
2中文信息学报2019 年
本挖掘技术,以人机结合的方式研发了中文医学
〇引言
2012年,谷歌提出了知识图谱(Knowledge
知识图谱第一版CMeKG 1. 0。本文综述了
CMeKG构建过程中的描述体系、关键技术、构建
流程以及医学知识描述相关问题。本文组织结构 如下:第1节介绍医学知识图谱相关研究工作,第 2节介绍CMeKG构建的总体方案,第3节介绍医 学知识描述体系,第4节介绍知识提取技术,第5 节介绍医学知识图谱构建的初步结果,第6节为 总结与展望。
G ra p h)的概念,为世界知识和领域知识的构建提
供了一个可资借鉴的手段:1]。知识图谱的基本组 成是由头实体、尾实体和两者之间的关系组成的 三元组关系。目前,对知识图谱的研究应用主要 包括通用知识图谱和垂直领域知识图谱。典型的 通用知识图谱有 Google Knowledge Graph-1-、
YAG()[2:、DBPedia[3]、CN-DBpedia[4]、XLore[5]等。
虽然通用知识图谱收集了大量的领域知识,但是 受到概念约束,无法完整描述比较复杂的领域知 识。垂直领域知识图谱在领域知识的描述方面优 于通用知识图谱,但常采用手工构建方法,因此其 构建成本很高。
在知识图谱概念提出之前,众多研究机构已经利 用知识库的存储方式构建了大量核心医学资源,如世 界卫生组织维护的国际疾病分类代码IO> 10 ™、美 国国立医学图书馆的一体化医学语言系统
1相关工作
医学领域术语和知识资源的收集与构建由来已
久,已取得显著的成果。比较典型的包括一些应用广 泛的医学术语集,如1〇>10、八丁(::16]和MeSH-17]等。
ICD-10是世界卫生组织维护的国际疾病分类
代码,它是包含疾病、症状、体征、异常发现、社会环 境以及外部原因导致的损伤或疾病的代码。1〇>10 编码以树状层级结构描述了 22大类的10 000多个 概念,通常辅助于公共卫生组织跟踪疾病、保险公司 理赔以及医院存储电子病历等任务。ATC是世界 卫生组织维护的解剖学、治疗学及化学分类系统.它 的本体结构依据的是药物成分对人体解剖学的治 疗、药理和化学特征效应,ATC'k包含消化道、血液 形成器官、心血管等U大类解剖学概念对应的药物 成分及其用法用量标准。MeSH是美国国立医学 图书馆编制的医学主题词表,它包含15大类所属的 18 000多个医学主题词,主要辅助PubMed标引和 检索医学文献。
中国中医科学院中医药信息研究所构建的中医 药知识图谱包含中医药学语言系统的100余万语义 关系,其主要目的是形象地表达概念之间的关系,通 过浏览界面提高用户检索领域知识的体验。随后, 上海曙光医院也构建了中医药知识图谱,实现了面 向临床应用的半自动化知识图谱的构建和知识问 答、辅助开药等应用。华东理工大学构建的中文症 状库是结合中医和西医知识自动构建的知识图谱。 中文症状库涉及10万多个实体及实体之间的20余 种语义关系,共包含60多万个三元组关系。中国医 学科学院医学信息研究所构建的医药卫生知识服务 系统知识图谱基于医学百科的医学知识,以可视化 界面展开医学百科知识。
综上所述,国外医学信息化领域存在结构化 程度较高、规模较大的资源(例如,UMLS等).而
UMLS17及其收录的100多种同表和分类体系、国
际医疗术语标准开发组织维护的系统化临床医学术 语集 SNOMED-CT …、Linked Open Data(LOD)收 集的1 000多种生命科学知识库、BioPomF、
Bi〇2RDF[ w等。上述医学核心资源对医学领域的
相关知识进行了专业的描述,这些资源可服务于医 学文献检索或医学术语标准化等医学信息化应用, 但还不能满足现代智慧医疗对医学知识描述的结构 化、精细化和自动化的需求。
鉴于医学知识图谱在知识推理、智能问答、辅 助诊断等智能医疗应用中的重要作用,已有一些 单位陆续开展了医学知识图谱的构建工作。中国 中医科学院中医药信息研究所基于已有的中医药 学语言系统[u]构建了中医药知识图谱〜]、上海曙 光医院和华东理工大学构建了中医药知识图 谱[13:、华东理工大学构建了中文症状库[14]、中国 医学科学院医学信息研究所构建了医药卫生知识 服务系统知识图谱:15 ]等。不过,现有医学知识图 谱从规模化、规范化、形式化、体系性等方面都仍 有很大的提升空间。如何基于高效的知识工程方 法、权威的医学数据资源、精准的知识描述体系和 先进的文本挖掘技术.构建大规模、高质量的医学 知识图谱.仍是极具挑战性的课题。
针对上述挑战,本文利用自然语言处理与文
10期奥德玛等:中文医学知识图谱CMeKG构建初探
3
中文医学知识目前以非结构化信息为主,缺少大 识图谱构建平台,形成知识图谱构建的自动化和规 规模结构化的开源资源。目前中文的医学知识图 范化工程模式;采集加T.多级医疗数据,建立高质量 谱在覆盖的知识规模[15]、知识的描述规范体 的中文医学知识图谱。作为CMeKG构建的第一阶 系[14]、知识的开源性:1213:和形式化等方面还存在 段,我们搭建了中文医学知识图谱的基础框架,并建 诸多不足。因此,我们的研究目标是建立大规模、 立知识图谱第一版。
高质量的中文医学知识图谱,为智慧医疗奠定专 在CMeKG的构建过程中,我们在语料处理和 业知识基础。
知识提取时充分利用了中文分词、命名实体识别以 及关系提取技术,通过技术手段提升了医学知识图 2中文医学知识图谱CMeKG构建总体方案
谱构建的自动化程度,扩大了可处理的医学文本的 来源和规模,使得知识图谱的信息更充分。同时,作 目前关于现代医学方面的中文医学知识图谱还
为一个医学知识图谱,不但要保证知识来源的充分 比较少。因此本文定位于现代医学中文知识图谱工 性,而且要考虑知识组织和知识内容的权威性。针 程构建研究,旨在介绍我们开发的中文医学知识图 对后者我们充分利用了医学领域国际标准dniCD- 谱,集中描述其总体构建流程和资源概貌。C M e K G 10、ATC、MeSH来组织和引导知识图谱构建过程, 的最终目标是制订层次清晰、高度关联的结构化医 保证我们的医学知识的权威性和系统性。基于以上 学知识描述体系,研发高性能的医学知识图谱构建 考虑,中文医学知识图谱CMeKG的构建流程如图 方法和关键技术;搭建基于自然语言处理技术的知
1所示。
中文医学知识图谱
CMeKG/1.0 版
图1 CMeKG构建流程
首先.我们参考国际标准,在医学专家的指导下 设计医学知识图谱模式层的规范体系。之后,在算 3 医学知识描述体系设计
法自动提取及人工标注、校对的基础上.整合提取医 学概念关系实例,并进行实体对齐和归一化处理。 CMeKG主要由疾病、药物和诊疗技术类概念
在上述步骤完成后,根据医学专家的评价和反馈,迭 及其关系和属性组成。CMeKG的医学知识抽象描 代地修正医学知识图谱。最终,形成中文医学知识 述框架如图2所示,图2中以支气管肺癌为例,描述 图谱CMeKG 1.0,并在可视化平台上展示。
了对应的主要实体关系和属性。
4中文信息学报2019 年
图2医学知识抽象描述框架
续表
概念分类
参考标准
样例
酒精性饮料生活质量信息管理医院护理人员卫生保健费用加拿大
3.1医学概念分类体系
概念分类体系的专业性和权威性对医学知识图 谱的质量具有十分重要的作用,本文参考ICD~10、
J工艺学,工业及农业K人文科学L信息科学M人
表1
概念分类
概念分类体系规范参考标准
样例
半月板,胫骨革兰氏阴性菌颅骨血管瘤氣化钠
血管成形术,气囊,激 光辅助单亲
三核苷酸重复扩增结肠镜检查,计算机体 层摄影殡葬仪式
MeSHMeSHMeSHMeSHMeSHMeSH
ATC、MeSH等国际标准医学术语集,将CMeKG
的概念层设计为15大类,如表1所示。
N医疗保健Z地理名称
A解剖学B有机体C疾病I)药物
E诊疗技术及设备F心理学和精神病学G生物科学H自然科学I社会科学
MeSHMeSHICD-10ATCMeSHMeSHMeSHMeSHMeSH
3.2医学概念的关系描述框架
为了更丰富、更精准地描述不同种类的医学知 识,基于上述医学概念分类体系,我们针对疾病、药 物和诊疗技术及设备等各类医学概念进行细化描 述,定义了各类概念的关系描述框架。每个概念的 关系描述框架由概念间的关系(概念关系)和概念与 属性之间的关系(属性关系)构成。我们共定义了 67种概念关系,例如,<药物类一症状类一适应症〉、 <疾病类一诊疗技术及设备类一检查>,以及194 种属性关系,用来描述某个概念实例的属性值(数字
10期
奥德玛等:中文医学知识图谱CMeKG构建初探
5
或字符串),如同义词、规格、成分、发病年龄、住院时 应症
间等。表2以支气管肺癌为例,展示了疾病类概念 •药物类中草药子类实体间常见关系:主 的关系描述框架。
治、人药部位、分布区域、别称、功效、属、 对于其他类概念的主要描述信息,简要列举 性味、毒性、界、目、种、科、纲、贮藏、采集 如下:
时间
•药物类西药子类实体间常见关系:()TC类 •诊疗技术及设备类实体间常见关系:就诊 型、不良反应、分类、商品名、性状、成分、英 科室、所属分类、相关疾病、相关症状、英 文名、药品监管分级、药品类型、规格、适
文名
表2
疾病类概念实体的关系描述框架
关系类型
关系子类型
关系取值样例
ICD编码
宇符串C34、D02. 2
语义
同义词、别称字符串
肺癌,支气管肺癌,支气管癌转移部位
淋巴结,锁骨上淋巴结,纵隔淋巴结
疾病一部位
外侵部位解剖学类心脏,交感神经发病部位左肺,右肺
临床症状
刺激性干咳,血痰/痰中带血,咯血
疾病症状
症状类
侵及周围组织转移的症状声音嘶哑,面部水肿,颈部水肿
辅助检查胸部影像学检查,纤维支气管镜.肺穿刺活检
影像学检查X线胸片,CT,磁共振成像
内窥镜检査
支气管镜检査,经支气管针吸活检术
疾病一检查
筛查诊疗技术及设备类
低剂量CT,常规胸片
实验室检查细胞学检查,剖胸探查术,ECT检查
其他检查胸腔穿刺术,胸膜活检术,浅表淋巴结及皮下转移结节 活检术
鉴别诊断
肺结核.肺部感染,肺部良性肿瘤
疾病一疾病
并发症疾病类
肺源性骨关节增生症•异位激素分泌综合症,异位促肾 上腺皮质激素分泌综合症
病理分型
小细胞肺癌,非小细胞肺癌,肺腺癌
疾病一其他治疗放射治疗诊疗技术及设备类根治性放疗.姑息放疗.辅助放疗
疾病一手术治疗手术治疗诊疗技术及设备类肺楔形及局部切除术•肺段切除术.肺叶切除术疾病一药物治疗药物治疗药物类血管内皮抑素,靶向治疗药物,多西紫杉醇疾病一流行病学
多发群体人类
吸烟者、慢性肺疾病者,接受过量放射线者就诊科室
胸外科,肿瘤科
疾病一其他
预防数值、字符串
禁止吸烟,控制吸烟,保护环境转移方式直接扩散.血行转移,淋巴道转移病因
吸烟.职业暴露,环境污染
疾病一社会学
风险评估因素有机体类、字符串
吸烟史(现在和既往).氡暴露史,职业史.患癌史高危因素
吸烟指数>400,年龄>45岁,环境与职业因素
6
中文信息学报2019 年
处理某一疾病时的标准指导和流程,具有专业性和
4医学知识提取技术
权威性。临床实践是面向临床医生和患者提供特定 临床情况处理和指导的临床决策支持工具。它将最 新的研究成果、诊断步骤、治疗步骤、指南、证据、专 家意见整合在一起,为实际临床工作及疑难情况提 供可靠的信息。4.2自动构建技术
不同的医学文本具有不同的形式特点。基于文 本特点,分别使用了基于规则和基于深度学习的两 种方法对多来源医学文本信息进行知识提取,本文 主要涉及提取医学概念关系三元组信息。自动提取 技术框架如图3所示,其中利用基于规则的方法提 取临床路径、医学网站和医学百科中的医学知识,利 用基于深度学习的方法来提取临床实践中的医学 知识。
4.1数据来源
我们在知识提取的过程中根据知识来源的权威 性排序,分为:国际/国家医学标准术语集、医学教 材、临床路径指南、临床实践文件和医学百科。
CMeKG构建过程中使用了 200余个权威的临床路 径文档、900余个临床实践文件以及百科类网络资 源等多源异构的医学文本数据。
医学标准术语集和医学教材通常是国际或国家 级机构统一规定的资源,其优点是权威性高、数据公 开可靠。临床路径是针对某一种疾病建立的一套标 准化治疗模式与治疗程序,是一个有关临床治疗的 综合模式,以循证医学证据和指南为指导来促进治 疗组织和疾病管理的方法。临床路径通常包含医院
图3自动提取技术框架
基于规则的知识提取对于临床路径、医学网 站和医学百科文本,我们缺乏标注数据,所以难以运 用监督学习的方法来从中自动提取三元组。但是, 这些数据并非是纯粹的文本,我们在从网络上爬取 它们的过程中,同时也获取了它们的半结构化信息,
例如,段落层级、标题和小标题信息等。实践发现. 在这些半结构化信息的帮助下可以构建一个基于规 则的自动提取系统,针对不同来源文本的不同特征, 构造出多样化的规则来对其进行概念关系的提取。 我们对医学百科数据构造了 38类规则,对医学网站
10期奥德玛等:中文医学知识图谱CMeKG构建初探
数据构造了 28类规则,对临床路径数据构造了 17 类规则,每一类规则由数条更具体的规则所组成,最 后在包含了 83类、数百条规则的规则系统下,我们 从临床路径、医学网站和医学百科文本中提取出了 百万量级的概念关系三元组。通过抽样的人工评 测,评估了基于规则的知识提取的精确率,对于从临 床路径、医学网站和医学百科中提取出来的三元组, 其精确率分别达到了 97%、96%和94%。
多三元组抽取的方法,主要分为两类:一类是先进 行实体识别再进行关系分类的pipeline方法;另一 类是同时进行实体和关系抽取的联合抽取方法。但 无论是哪种方法,在现有数据集上的实验结果都达 不到令人满意的效果,作为医学知识图谱中使用的 三元组数据,其精确度一定要有较高程度的保障,否 则可能会引来许多问题。我们的任务是从一篇文档 中抽取三元组,不同于以往的三元组抽取,其特殊性 基于深度学习的知识提取随着基于规则提取 在于,数据中的一篇文档总是围绕着一个疾病实体 的三元组数据和人工标注的临床实践数据的积累, 来展开的,所以本质上只需要抽取另一个实体以及 我们拥有了足够丰富的资源,已在临床实践数据上 两个实体之间的关系。如图4所示,对于围绕“皮肤 实施基于深度学习的医学知识提取。从文本中抽取 鱗状细胞癌”疾病的文档,我们只需要抽取“Mohs 三元组是一个被研究已久的任务,目前已经存在许
手术”实体以及“手术治疗”的关系即可。
疾病名:皮肤鱗状细胞癌描述文本: 手术治疔
越早发顧小SW雜
K少挪.IWS蝴W. 雜术的训
练以达到最佳的美观效果。
图4关系提取任务图示
考虑到这样的特殊性,我们提出了一套新的基 一个字,“R-E”标注该实体的最后一个字,“R-M”标 于标注的三元组抽取方法。我们采取“关系名+
注该实体中间的字。如果该实体本身只有一个字, BMES”的标注方式,如果某个实体与文档描述的疾
则用“R-S”来标注该实体。其他无关的字我们用 病之间存在关系R,则用“R-B”来标注该实体的第
“()”来标注。标注方式的示例如图5所示。
f-术治疗-M F术治G-M f-术治疗-M f术治疗-M
越¥犮现越小的肿瘤能减少变形、畸形发生的几率,并丨iMohs f木医生经过
I建技术的卯练以达到最佳的美观效果. / \\
手术治疗-B
T•术治疗*£
图5
“关系名+BMES”标注方式图例
在这样的标注方式下,我们采用了 BiLSTM +
万条三元组数据,通过抽样的人工评测评估了基于 softmax分类模型来预测每个字的标签,先用双向 深度学习的知识提取的精确率,其精确率达到了 LSTM得到每个字的隐向量,然后将该隐向量通过 .2%。这样高精确率的自动提取方法在大幅提升 MLP和Softmax层,使其变为一个维的概率向
知识库构建效率的同时,能够保证知识库内容的高 量,其中f为标签种类数。训练时,我们首先按照 度可靠性。
“关系名+BMES”的标注方法将训练集中的数据进 行标注,然后将其送人模型进行学习。测试时,我们 5 中文医学知识图谱CMeKG 1.0
首先预测出每个字的标签,然后对标签进行匹配,即 每找到一个配对同一关系R的完整的“BMES”集 我们在医学专家的配合下,制订了医学知识描
合,我们便取出这个集合对应的实体E,形成一个 述体系,收集了多来源的大规模医学文本,通过人工 (疾病名,R,实体E)的三元组。我们的模型结构如 标注和自动提取方法相结合,构建了中文医学知识 图3下方展开的方框部分所示。
图谱CMeKG。CMeKG 1. 0版包括6 310种疾病、 我们用该方法在临床实践数据中提取了 20余
19 853种药物、1 237种诊疗技术及设备.涵盖疾病
8
中文信息学报2019 年
的临床症状、发病部位、药物治疗、手术治疗、鉴别 诊断、影像学检查、高危因素、传播途径、多发群体、 就诊科室等以及药物的成分、适应症、用法用量、有 效期、禁忌证等常见关系类型,关联到的医学实体达 20余万,CMeKG目前的概念关系实例及属性三元 组达1〇〇余万。同时,基于以上医学实体和关系三 元组,我们开发了 CMeKG的展示平台,网址为:
CMeKG使用百度开源可视化库Echarts[16]展
示知识图谱,平台展示内容主要包括树状结构和网 状图谱两部分,提供的功能包括实体的搜索、匹配、 图谱的链接和遍历。对于每一个实体,选择以该实 体为主语的三元组进行显示,连接同一节点的相同 颜色节点代表相同的语义关系,整体效果呈现为以 查询实体为中心.具有语义关系的相关实体发散至 四周的网状结构,如图6所示。
http : //cmekg. pci. ac. cn/,CMeKG
事疾病
S參百种常见病* A
9 _B 9 •〇 9 #D
Chines* Medical Knowledge Graph
中文医学知识图谱
知识图谱
API
关于我们
丨 1031
知识图谱 |支气管肺癌
Knowledge Graph
9 #E
mBF9 _H
冬0 士
结核病
ihy,
ldct)
两fi部馒性炎症
1—2,
\\ /
8B • J
9
田參M
田_NS參P
田_Q
* L
a 9S
接受i
⑩早产
馨真菌性脑膜炎 馨支气管肺癌 •痔
⑩中耳炎
參转移性乳腺癌 •子宫内膜癌
•自身免疫性肝炎
a#其它常见病 s_其它病 s •药物3 •诊疗技术及设备(治疗)
9
右痛
_移_升高
图6 CMeKG结果展示图
6结束语
我们对医学知识图谱的构建研究才刚刚起步,
致谢
感谢郑州大学第一附属医院牛承志老师、郑州 大学第三附属医院赵悦淑主任及北京大学医学部詹 思延教授给予的指导建议!
本文综述了 CMeKG 1. 0构建过程中的描述体系、 关键技术、构建流程以及初步的构建结构。我们认 为,未来服务于智慧医疗的知识图谱应该满足以下 方面的要求:知识来源具有权威性、知识组织具有 系统性、知识内容具有丰富性、知识描述具有精准 性、知识更新具有高效性。因此,医学知识图谱的构 建任重而道远,在未来我们将朝着构建大规模、高质 量、融合文本、图像与视频等多模态信息的医学知识 图谱的方向继续努力。
参考文献
[1] Singhal A. Introducing the knowledge graph: things,
not strings [EB/OL]. Official google blog, 2012. https ://googleblog. blogspot. com/2012/05/introducing- knowledge-graph-things-not. html.[2] Fabian M, Suchanek Gjergji ♦ Kasneci Gerhard Wei-
10期奥德玛等:中文医学知识图谱CMeKG构建初探
kum. YAGO: A large ontology from Wikipedia and WordNet[J]. Web Semantics: Science,Services and Agents on the World Wide Web, 2008(3): 203-217.[3] Christian Bizera, Jens Lehmannb, Georgi Kobilarova,
et al. DBpedia-A crystallization point for the Web of data[ J ]. Web Semantics: Science,Services and A- gents on the World Wide Web, 2009(07): 1-165.[4] Bo Xu, Yong Xu, Jiaqing Liang, et al. CN-DBpedia:
A never-ending Chinese knowledge extraction system [JJ. Lecture Notes in Computer Science, vol 10351. Springer, Cham. 2017(10351): 428-438.
[5] Zhigang Wang, Juanzi Li, Zhichun Wang,et al.
XLore: A large-scale English-Chinese bilingual knowledge graph[C]//Proceedings of the 12th International Senatic Web Conference (ISWC 2013) on Posters Demoustrations Track.
[6] World Health Organization. International Statistical
Classification of diseases and related health problems. (10th Revision)[OL] https://icd. who. int/browselO/ 2016/en.
[7] Nadkarni P, Chen R, Brandt C. UMLS concept inde
xing for production databases [J]. Journal of the A- merican Medical Informatics Association, 2001,8(1): 80-91.
[8] Donnelly K. SNOMED-CT : The advanced terminology
and coding system for eHealth [J]. Studies in Health Technology and Informatics,2006,121(121): 279-90.[9] Natalya F Noy, Nigam H Shah,Patricia L Whetzel,et
al. BioPortal: Ontologies and integrated data resources at the click of a mouse [J]. Nucleic Acids Research,
奥德玛(1994一),硕士研究生,主要研究领域为 知识图谱构建与融合。
E-mail: odmaa_b@pku.edu. cn
穗志方(1970 —).通信作者,博士.教授,主要研 究领域为计算语言学、文本知识工程。
E-mail : szf@pku.edu.cn
2009, 2009(37): 170-173.
[10] FrancBois Belleau, Marc-Alexandre Nolin, Nicole
Tourigny, et al. Bio2RDF: Towards a mashup to build bioinformatics knowledge systems [J]. Journal of Biomedical Informatics,2008, 2008 ( 41 ): 706- 716.
[11] 贾李蓉,于彤,崔蒙,等.中医药学语言系统研究进
展[J].中国数字医学,2014, 9(10): 57-62.
[12] 贾李蓉,刘静,于彤,等.中医药知识图谱构建[J].
医学信息学杂志,2015, 36(8): 51-59.
[13] 阮彤,孙程琳,王昊奋,等.中医药知识图谱构建与
应用[J].医学信息学杂志,2016, 37(4): 8-13.
[14] Tong Ruan, Mengjie Wang, JianSun, et al. An auto
matic approach for constructing a knowledge base of symptoms in Chinese [J]. Journal of Biomedical Semantics, 2017, 8(33): 71-79.
[15] 刘燕,傅智杰,李姣,等.医学百科知识图谱构建[J].中华医学图书情报杂志,2018, 27(6): 28-34
[16]
Deqing Li,Honghui Mei,Yi Shen, et al. ECharts : A declarative framework for rapid construction of wed-based visualization[J]. Visual Informatics, 2018, 2(2):
136-146.[17] ATC/DDD index of 2019 [EB/OL]. WHO collabora
ting Centre of Drug Statistics Methodology, 2019. https: //www. whocc. no/atc/structure_and_principles/.
[18]
Nelson S J, Johnston W D, Humphreys B L. Relationships in medical subject headings (MeSH) [M]. Relationships in the Organization of Knowledge. Springer Netherlands, 2001: 171-184.
杨云飞(1995—),硕士研究生,主要研究领域为 知识图谱与信息抽取。
E-mail: yfy@pku. edu. cn
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- igat.cn 版权所有 赣ICP备2024042791号-1
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务