谢志耘:同学们好!我是文献检索主讲教师谢志耘,现在开始给大家进行文本辅导。
谢志耘:同学们有任何问题可以提出来,我们一起讨论! 赵新胜:谢老师,您辛苦了! 谢志耘:不客气
谢志耘:现在开始发布学习辅导材料。
第一章 概论
主要知识点
第一节 基本概念
信息是无形的,它是客观事物的运动状态和特征的反映,是人们认识事物发展的基础。事物是不断变化发展的,那么它的运动状态和特征也应随着不断变化而发展。在人类已经进入信息社会的今天,信息被视为如同能源、空气和水一样重要。信息资源被视为与自然资源同等重要的第二资源。人们将一个国家信息化程度的高低作为衡量一个国家发展水平的标志。一个国家科学技术发展水平、经济持续发展都与信息的开发和利用密切相关。
知识是人类对自然界、人类社会中各种现象、规律的信息反映进行思维分析,加工提炼,经过系统化、理论化的过程。也就是人的大脑通过思维重新组合的系统化的信息集合。因此,系统化、理论化的信息就称为知识。信息是知识的源泉、材料,知识是信息的理论和结果。 情报是人们在一定的时间内为一定的目的而传递有使用价值的知识或信息。这种情报具有保密性、时效性、传递性的特点。情报的种类有多种。按服务对象不同,可分为军事情报、科技情报、战略情报、战术情报等;按传递媒介分为文字情报、实物情报、声像情报;按传递范围分为大众情报和专门情报。
三者的关系是:信息是知识的源泉;知识是系统化、理论化的信息;情报是活化的知识和信息,能为人们所利用,其涵义关系是信息>知识>情报。
第二节 文献的基本概念
一、文献的定义和属性
凡属于人类的知识,用文字、图形、符号、声频、视频等手段记录保存下来,并用以交流传播的一切物质形态的载体,都统称为文献。知识是文献的实质内容,载体是文献的外在形式,而记录是联系知识与载体的手段。
二、科技文献的类型
(一)根据加工层次划分
1.一次文献:即原始文献,是作者根据自己的工作和研究成果而写成的文章,也可称
原始论文。其特点是内容有创新性,含有前所未有的发明创造,或者一些新的见解与理论,是科学技术有所前进的标志。一次文献是对知识的第一次加工,是信息的基础,也叫信息源。一次文献包括:期刊论文、研究报告、会议录、专利说明书、学位论文等。
2.二次文献:二次文献是对一次文献进行收集、分析、整理并按照其外部特征或内部特征(篇名、作者、作者地址、刊名、出版年、卷、期、页、分类号、内容摘要等)按一定的规则加以编排,供读者检索一次文献之用。二次文献包括:目录、索引、文摘等。二次文献通常是由图书信息机构组织人力物力编辑出版的,它起着汇集文献、提炼文献和提供文献线索的作用。
3.三次文献:三次文献是科技人员在利用二次文献的基础上,对一次文献阅读、分析、归纳、整理和推理,进行概括、论述,重新组织、加工提炼成文字,可供人们了解某一学科或专题的进展,了解其过去、现在和预测未来的发展趋势的文献。三次文献包括:综述、评论、述评、进展、动态、年鉴、专著、指南等。三次文献一般是由专家写成,水平较高,专业性强。
4.零次文献:零次文献一般认为是形成一次文献之前的信息、知识、情报,即未经记录或未公开于社会的最原始的文献,或没有正式发表的文字材料,如书信、手稿、笔记、记录等。
(二)按载体形式划分 1.印刷型(printed form):印刷型文献是指印刷到纸张上保存下来的文献。 2.缩微型(micro form):缩微型文献是以感光材料为载体,用摄影的方法把文献的影像体积缩小,记录在胶卷或胶片上。
3.视听型(audio-visual form):视听型文献是指记录声音和图像的文献,包括:唱片、录音带、录像带、幻灯片等。
4.电子型(electronic form):此文献是以数字形式将信息存储在磁盘、磁带、光盘或网络等介质上,并通过计算机或远程通讯进行阅读的文献。
(三)按文献出版类型划分
1.科技图书(book):科技图书其内容比较成熟、系统、全面、可靠。一般分为两种类型:①阅读类:包括教科书、专著、文集、科普读物等。②参考工具书:包括字典、辞典、指南、人名录、机构指南、手册、年鉴、百科全书等。
2.科技期刊(journal, periodical): 一般是指采用统一名称(刊名)定期或不定期出版的连续性出版物(serials),有连续的卷、期号或年、月顺序号。 核心期刊(Core Journals)是科技期刊中一类特定的期刊,指刊载某学科文献密度大、载文率、被引用率及利用率较高,深受本学科专家和读者关注的期刊。目前国内外确定核心期刊和评价质量的方法最主要并常用的方法是:载文率法和引文法。
3.资料(Material):非书非刊的出版物,又称特种文献。
(1)专利文献; (2)科技会议文献; (3)科技报告;(4)出版物;(5)学位论文:(6)标准文献:(7)产品资料:(8)技术档案:
三、科技文献的特点 (一)数量多、增长快
(二)内容交叉渗透、分散重复 (三)语种不断增加 (四)失效快、寿命短
(五)文献发表的时间滞后严重 (六)交流传播速度加快 (七)日益向多元化发展
第三节 文献检索基本知识
一、文献检索的概念
文献检索是将文献按照一定方式集中组织和存储起来,并按照文献用户需求查找出有关文献或文献中包含的信息内容的过程。所以广义上的文献检索实质上是包括文献的存储和文献的检索两个过程。
二、检索语言
检索语言(retrieval language)是用于描述检索系统中文献的内容特征及外表特征和表达用户检索提问的一种专门语言。
(一)检索语言的类型及特点
1.按照检索语言中所使用语词的受控情况可分为规范语言(controlled language)和非规范语言(uncontrolled language)
规范语言,又叫受控语言、人工语言(artificial language),是一种采用经过人工控制了的规范性的词语或符号来作为检索标目,来专指或网罗相应的概念,这些规范化的标目能较好地对同义词、近义词、相关词、多义词及缩略词等概念进行规范。使用规范化的词能相对提高检索的效率,但对检索者和情报存贮人员在选词上要求比较严格。规范语言又包括单元词语言、标题词语言、叙词语言等。
非规范语言,又叫非受控语言、自然语言(natural language),是采用未经人工控制的词语或符号来作为检索标目,通常所说的自由词、关键词就属此类。
2.按照检索语言所描述的文献信息特征的内容可分为描述文献内容特征的语言和描述文献外部特征的语言,其中前者又可分为分类语言、代码语言、主题语言(包括关键词、单元词、标题词、叙词语言等);后者又可分为书/刊/篇名、著者/团体著者、引文、代码/序号。
(1)分类语言:是一种直接体现知识分类的等级制概念标识系统,是按照学科范畴划分而构成的一种语言体系。它能集中体现学科的系统性,反映事物的从属、派生关系,并从上至下、从总体到局部层层划分、展开,是一种等级分明的语言。
(2)代码语言:是对文献所论述事物的某一方面的特征,用代码加以描述和标引的语言,如:化学物质的分子式、化学物质登记号、基因符号等。
(3)主题语言
①关键词语言:关键词(Keyword)语言是直接从文献的篇名、文摘或全文中抽取出来的词汇构成的。在检索工具中常以关键词索引出现。关键词语言基本上是未经规范性处理的语言,属于自然语言的一种。关键词语言由于未经规范,用词不统一,因而漏检率高,检全率较低。
②标题词语言:标题词(Heading)语言是最早使用的一种主题语言,它使用的词汇也是从文献内容中抽出,但与关键词语言不同的是,它们都是能代表文献内容特征的规范化词语,属于规范语言的一种。标题词语言检索之前,词与词之间的组配已经固定,这种形式又称为先组式语言。标题词语言具有较好的通用性、直接性和专指性,但其又是先组式语言,因此灵活性较差。
③单元词语言:单元词(Uniterm)是一种最基本的、不能再分的单元词语,亦称元词,
它也是从文献内容中抽出,并经过规范化处理,代表一个的概念。元词具有灵活的组配功能,在检索时可以将某些元词组配起来代表某一特定概念,因此这种语言属于后组式语言。
④叙词语言:叙词是在标题词、单元词和关键词基础上发展起来的,叙词和关键词语言是目前使用较多的两种检索语言。叙词语言是规范性后组式语言,但其与上述的单元词语言不同的是,它既包括了单个的词,也包括了词组,它可以用复合词表达主题概念;而且单元词是字面组配,叙词则是概念组配。叙词语言集规范性语言与后组式语言之优势,既在用词上达到统一,又有较好的灵活性,它与其它类型的检索语言相比,是一种多功能的较完善的检索语言,能大大提高文献检索的查准率和查全率。
三、检索工具
(一)文献信息检索工具的概念
文献信息检索工具是指用以存储、报道和检索文献的工具,它具有存储、报道和检索三个职能。
查全率和查准率是反映文献检索工具质量的两个最主要也是最常用的指标,它们也是评价检索效果高低的两大因素。查全率(recall ratio)和查准率(precision ratio)分别用字母R和P表示,它们的定义可用如下式子表示 :
克兰弗登经一系列试验结果表明,查全率和查准率之间存在互逆关系。如果一检索工具的查全率较高,则其查准率将相对下降;反之查准率高,则查全率低。查全率和查准率只能相对提高,二者永远不可能同时达到100%。
(二)文献信息检索工具的类型及特点
1.目录:是对图书或其它单独出版的资料的系统化记载及内容揭示,通常以图书、期刊作为报道单元。按照职能划分有出版发行目录、馆藏目录、资料来源目录等;按收录文献种类划分有图书目录、报刊目录、标准目录、专利目录等;按物质载体形式可分为卡片目录、书本式目录、磁带式目录(机读目录)等。
2.题录:以一篇篇内容上的文章作基本著录,并只著录文献的外部特征,包括文献篇名、著者、著者单位、原文出处、语种、专利号、合同号等各项内容。目录著录的是一个完整的出版单元,而题录著录的只是一个完整的出版物的某一部分,例如期刊中的论文、图书中的章节等。如《全国报刊索引》、《中文科技资料目录》、《Index Medicus》。
3.文摘:除了描述文献的外部特征之外,还对文献的内容特征作较深入的报道,即带有文献的摘要。文摘型检索工具比题录和目录型检索工具揭示文献内容要深,因此它所报道的速度相对较慢。如:《中国医学文摘》、荷兰《医学文摘》等。 4.全文:全文型检索工具不仅能获取文献的题录信息,还能得到文献的原文内容。如:《中国期刊网全文专题数据库》(CNKI)、《保健、医学与药学电子期刊全文数据库》等。
(三)文献检索工具的结构
检索工具一般由编辑使用说明、目次表、正文、索引和附表等五个部分组成。
四、检索方法、途径和步骤
(一)检索方法:
1.追溯法:也叫引文法,是一种跟踪查找方法。通过文献后面列出的一系列参考文献
条目的指引,追查到那些参考文献的原文的方法。
2.常用法: 利用检索工具来查找文献的方法。
3.综合法:也称分段法、交替法或循环法,是将以上两种检索方法结合起来,交替使用,发挥它们的综合优势。
(二)检索途径
1.分类途径:主要是利用分类索引或分类号,或者检索工具前附有的分类目次表,直接按照文献所属的类别来检索文献的途径。
2.主题途径:主要是通过主题索引、单元词索引、关键词索引、叙词索引、主题轮排索引等,直接按字顺找到所需主题概念的位置,并进一步获取文献的途径。
3.著者途径:主要是利用著者索引,包括个人著者索引和团体著者索引(即机构名称),按照著者姓名或机构名的字顺来查找出它们所发表的或主持的文献。
4.号码途径:利用各种号码索引(报告号、合同号、专利号、标准号、化学物质登记号等)来查找文献。号码索引一般按照字母顺序或号码顺序来排列。
5.其它途径:某些特定专业的检索工具还编有特定形式的索引,如分子式索引、动植物名称索引、药物名称索引、基因符号索引等,这些适于某些特定专业领域利用的索引系统可作为一种辅助检索途径。
(三)检索步骤 1.分析课题
2.选择检索工具和方法 3.选择检索途径和检索标识 4.查找文献
5.获取原始文献
第二章 国内文献检索刊物
主要知识点
第一节 国内检索刊物概况
一、国内检索刊物的历史和现状
我国1934年开始有文摘性检索刊物。20世纪50年代中期,开始出版医学索引刊物。1956年,中国科学技术情报研究所成立,标志着国内检索刊物编辑出版工作开始走上有领导、有组织、有计划地发展道路。到目前,已经纳入国内科技文献检索刊物体系的检索工具刊有200多种,其中医学文献检索刊物有10多种。
二、国内检索刊物的特点
1.收录范围:主要收录国内期刊论文、汇编及学术会议论文等文献和翻译成中文在国内刊物上发表的国外文献。
2.回朔年限:有对近期国内科研文献的报道,也有对一个时期内国内科研文献的报道。 3.规范化程度:医学检索刊物根据《汉语主题词表》、《医学主题词注释字顺表》和《中国中医药学主题词表》进行标引。
4.检索途径:以主题途径和分类途径为主,部分检索刊物有作者途径。
5.专业应用范围:按学科内容分为综合性、社会科学类、自然科学类检索刊物等。
6.编排结构:有编辑说明、分类目次、正文部分、主题索引、著者索引和引用报刊、资料一览表等。国内医学检索刊物的正文部分一般依据《中国图书分类法》编排。
7.编排方式:有目录、索引、文摘。
8.出版形式:有期刊式、单卷式、卡片式等。
三、常用国内医学文献检索刊物
国内常用的医学文献检索刊物一般分为题录式和文摘式两种。题录式检索工具刊主要包括:《中文科技资料目录》(医药卫生)、《国外科技资料目录》(医药卫生)、《中文科技资料目录》(中草药)、《1949-1979 医学论文累积索引》、《全国报刊索引》(科技版)等等。文摘式检索工具刊主要有《中国医学文摘》、《中国药学文摘》、《中国生物学文摘》、《国外医学》等等。
第二节 《中文科技资料目录》(医药卫生)
一、概况
《中文科技资料目录》是以题录形式报道国内所有科技文献的索引式检索工具刊,共有三十四个分册,《中文科技资料目录》(医药卫生)是其中一个。《中文科技资料目录》(医药卫生)创刊于1963年4月,由中国医学科学院医学信息研究所编辑、出版和发行,原为双月刊,从1984年起,改为月刊。该刊收录文献的范围包括医学和与医学有关的期刊、汇编(内部资料)和学术会议资料。目前收录期刊300余种,现年报道题录约5万条左右。
二、编排结构
《中文科技资料目录》(医药卫生)采用以学科分类为主,主题索引为辅的方法对题录进行编排。每期的编排结构介绍如下。
(一)编辑说明:对本刊的性质、创刊时间、沿革变化、收录情况、编排方法、附录情况、分类方法、著录规则、学科分类、主题索引、文献的索取、复印以及订购等情况做一一介绍。
(二)分类目次:是本刊的主要检索途径之一,各级各类都由分类号、类目名及所在页码组成。
(三)正文部分:为本刊最主要的部分,也是主体内容,是按学科分类的类目次序编列。 (四)学科分类类名索引:将各类目的类名按汉语拼音字顺排列,括号内为分类号,为不熟悉分类法的读者使用分类目次查阅正文提供方便。
(五)主题索引首字字顺表:将每个主题词的第一个汉字按汉语拼音字顺依次排列,提示主题词所在的页码。
(六)主题索引:由主题词、副主题词和题录顺序号组成。使用主题索引时应根据顺序号到正文的相应题录顺序号查阅文献。主题索引是对正文部分文献查找的一条主要检索途径。
(七)本期引用期刊一览表:将本期引用期刊的刊名、年、期列出。
(八)国内入藏期刊代号:沿用1963年本刊所编的单位代号表将国内馆藏期刊代号及刊名列出,便于在馆际之间查找原文。
(九)本刊收编国内期刊一览表:将本刊所收编的国内医药卫生期刊的刊名、编辑出版单位和入藏单位代号列出,期刊名称前带星号\"*\"的为核心期刊。
三、著录格式
(一)期刊
①0144307 ②低分子肝素在水溶液中的水解动力学 ③/李俊领(沈阳药科大学)„ ④//沈阳药科大学学报. ⑤-2001,(1) .⑥-9-11
说明:①题录顺序号:01为年份,其后五位数字为按分类编排的题录顺序号(每年均从第一期1号开始连续排到第十二期为止);②文献题名:如果是综述型文献在题名之后加[综述]字样; ③著者:只著录第一位著者,其他著者用\"„\"表示,其后括号内为著者所在的工作单位;④期刊刊名;⑤期刊的出版年、期;⑥原文起止页码,如有转页,在起止页码之后加\",\"号再将转页页码标清,如:6~10,15。
注:期刊的编辑出版单位在\"本刊收编国内期刊一览表\"中列出。
(二)图书
①9713485 ②综合避孕方法(和服务指南) ③//人民卫生出版 ④.-1997,3.⑤-1-96
说明:①题录顺序号;②图书书名;③出版单位;④出版日期;⑤原文起止页码。 (三)会议资料
示例(整本资料):
①0047315 ② 第三次中华医学会精神病学分会学术年会[会] ③//中华医学会精神病学分会.④ -2000,4. ⑤ -1-238
说明:①题录顺序号;②会议论文整本资料题名;③编辑出版单位;④出版日期;⑤原文起止页码。
示例(多题资料):
①0045501 ②周围神经端侧吻合的研究进展[会]③ /洪光祥(同济医科大学附属协和医院手外科)④//中华医学会手外科学会第八届全国学术会议论文汇编.⑤ -2000,5. ⑥ -18-20
说明:①目录顺序号;②文献题名;③著者及其所在单位;④论文汇编名称;⑤出版时间;⑥原文起止页码。
(四)汇编资料的著录规则与会议文献中的多题资料相同。
四、检索途径及使用方法
(一)分类途径:是从学科分类入手,以分类号、类目名为检索标识检索文献的途径。 (二)主题途径:是指以经过规范化的主题词为检索标识,利用主题索引检索文献的途径。在查找一项专指性很强的课题时,可以用主题途径检索。 (三)如何利用分类途径与主题途径
1.分类法学科体系稳定,不易产生漏检,但不能及时反映新兴学科及新的发展;主题途径灵活,有利于检索较新的课题,但可因用词不当而造成漏检。
2.分类法的类目概念一般比较大,不能一一对应,适用于检索概念含义较广的课题;主题途径中主题词专指性强,概念与主题词相对应,适用于检索概念专指性强的课题。
3.分类法按学科集中文献,适用于族性检索;主题途径中是以主题词集中文献,适于
特性检索。
第三节《中国医学文摘》
一、 概况
《中国医学文摘》是报道医学文献的系列检索期刊,是一套很有使用价值的文摘性检索工具。 从1982年开始出版发行,目前已出版18个分册,收录国内医药刊物180种左右,分为核心期刊和周围期刊两类,并将前一年度所引用的期刊做年度引用期刊一览表附在每年(卷)第一期。各个分册由不同的单位编辑出版,但出版周期较长,平均报道时差为6~7个月。
二、编排结构
《中国医学文摘》每期由以下各部分组成: 1.出版说明: 2.目次:
3.正文部分:
4.引用期刊一览表:
5.主题索引:
6.著者索引:部分分册附有著者索引,著者索引在每年(卷)的最后一期,按著者姓名的汉语拼音字顺排列,在著者姓名后有文摘号,便于从作者的角度检索。
三、检索途径及使用方法
(一)分类途径:在每一分册的首页均有分类目次或目录,是以《中国图书资料分类法》为编排依据,结合各学科的特点,将各个分册所收录的文献按分类编排,查找每一期的文献时,可利用分类目次检索文献。
(二)主题途径:一般在各个分册每年(卷)最后一期的正文之后附有年度主题索引,在少数分册中每期附有主题索引,在检索文献时,可以充分利用年度主题索引对全年各期文献进行查找。当所查课题涉及两个或两个以上的主题词时,必须将这些主题词后所列的题录顺序号相对照,共有的题录顺序号才是本课题所需要的文献。
(三)著者途径:《中国医学文摘》部分分册的最后一期附有年度著者索引,著者索引按著者姓名的汉语拼音字顺排列,在著者姓名之后列有文摘号,提供从某一作者的角度查找其所发表文章的检索途径。
第三章 国外文献检索刊物
主要知识点
第一节 国外检索刊物概况
一、国外检索刊物的历史和现状
1665年1月5日,法兰西科学院在巴黎创办了《学者周刊》,是世界上以专栏和附录形
式出现的最早的文摘刊物。19世纪初,文摘工作开始走向成熟定型阶段。1879年,美事医学图书馆(美国国立医学图书馆的前身)编制了世界上第一种医学文献索引-《世界最新医学文献季度分类记录》(现名为美国《医学索引》)。 20世纪上半叶,产生了一大批专题性的文摘刊物。 目前国际上影响最大,覆盖面最广、最具权威性的科技文献检索工具有美国《工程索引》、英国《科学文摘》、《文摘杂志》和日本《科学技术文献速报》,号称国际四大检索刊物。
二、国外文献检索刊物的特点
1.历史悠久、发展快速:如美国《工程索引》1884年创刊,而且在其发展过程中,不断地变更完善其编排体例。
2.规范性和实用性:西方国家很早就提出了诸如主题词法、关键词法、单元词法和标题词法等编排方法,以完善其规范性和实用性。
3.规模大、质量高:往往收录世界上多个国家、多个语种和多学科领域方面的文献,涉及范围广泛,报道量大,报道文献的类型丰富多样。
4.索引体系完备:国外大型检索刊物都具有较完善的索引体系,为检索者提供较全面的检索入口。
三、常用国外文献检索工具刊
1.美国《工程索引》(The Engineering Index,简称EI)
2.英国《科学文摘》(Science Abstracts,简称SA) 3.《文摘杂志》(PeфepaтивнъIй журнал,简称P.ж.) 4.日本《科学技术文献速报》 简称《速报》 5.美国《科学引文索引》(Science Citation Index,简称SCI) 6.美国《医学索引》(Index Medicus,简称IM) 7.美国《生物学文摘》(Biological Abstracts,简称BA) 8.美国《化学文摘》(Chemical Abstracts,简称CA) 9.荷兰《医学文摘》(Excerpta Medica,简称EM):
第二节 美国《医学索引》
一、概况
美国《医学索引》(Index Medicus,简称IM),是当今世界上最常用的生物医学文献题录型检索刊物,创刊于1879年。现由美国国立医学图书馆(National Library of Medicine, NLM)编辑出版,为月刊,平均时差3个月。
二、特点
1.收录范围广
2.编辑力量强、标引质量高 3.时差短
4.编制简单、查找方便
三、编排结构
(一)期索引的组成
期索引,又称月刊本。目前每期分两册出版(Part 1、Part 2),其内容依次为主题索引部分、著者索引部分和医学综述题录。另外在出版第1期的同时,还单独出版一本《医学主题词表》(Medical Subject Headings,简称MeSH)和一本\"收录期刊一览表\"(List of Journal Indexed in Index Medicus)两个单行本。全年共26本。《医学主题词表》是一本指导IM主题检索的辅助工具。
(二)期索引的编排结构
1.主题索引部分(Subject Section):将IM收录的全部文献题录按主题词和副主题词作为索引标目,形成主题检索的标目系统。主题索引的具体排列规则如下:
(1)整个索引按主题词字顺排列;
(2)同一主题词下按副主题词字顺排列;
(3)相关内容的文献题录分别纳入相应的主题词或主题词/副主题词之下;一般总论性文献直接入主题词下,专指性文献入相应的副主题词下;同一文献题录可入多个主题词之下;
(4)同一主题词或副主题词下的文献题录,先排列原文为英文的文献、后排列非英文文献,非英文文献的英译标题用\"[ ]\"括起,以示区别;
(5)英文文献按刊名缩写字顺排;
(6)非英文文献先按文种缩写字顺排,同一文种下按刊名缩写字顺排;
2.著者索引部分(Author Section):以著者(包括合著者)的姓名为标目,按其字顺排列而成的索引。著者姓名的著录形式采用姓氏在前、用全称,名字在后、用缩写(取首字母、大写)。著者索引的具体排列规则如下:
(1)仅在第一著者后列出全部其它合著者、篇名和出处等;
(2)非第一著者用\"see\"指引到第一著者,读者须据\"see\"之后的第一著者再查;
(3)有关某人的生平传记或讣告的文献题录除在文献第一作者下出现外,同时还以被传人作标目列出;并将被传人姓名置于圆括号中以示区别;
(4)匿名文献(原始文献未注明作者),其文献题录按刊载论文的刊名缩写字顺集中排在著者部分的后部\"匿名著者(Anonymous)\"部分。
3.医学综述题录(Bibliography of Medical Reviews,简称BMR):将主题索引部分或著者索引部分中出现的所有综述性文献单独抽出、集中编排而成的索引。其排列规则及著录格式同主题索引。
(三)卷索引的编排结构
卷索引(Cumulative Index Medicus,简称CIM),也称为累积医学索引,是为了方便回溯检索,在一年的12期月刊本出齐后,在第二年的年头将上一年的全年文献题录内容全部集中,重新按照主题、著者和医学综述题录的字顺分别进行排列而形成的索引。月刊本便于查找近期最新发表的文献,而要查找前些年的文献,应尽量使用CIM,以提高检索效率。
四、《医学主题词表》(Medical Subject Headings,MeSH)
医学主题词表是提供读者进行自然医学词汇规范处理,并使用规范化的主题词检索文献的一本辅助工具。利用主题词查找文献,可提高文献的查全率和查准率。MeSH表从1963年开始出版,每年再版一次,与月刊本第一期同时出版。到2002年,MeSH表共收入主题
词约18,000多个,并通过注释、参照系统和树形结构等反映主题词的历史变迁和词间的相互关系。MeSH表主要由主题词变更表、字顺表、树状结构表和副主题词表四个部分组成。
(一)主题词变更表:主要介绍当年主题词的增删更改情况。 (二)字顺表:是以全部主题词(包括少量款目词、类目词)按英文字母顺序排列而成。词间关系用参照系统反映。参照系统共有三组,分别表示三种不同的词间语义关系。 1、用代参照:揭示词间等同关系,其参照符号为see(见)和 X(代)。例如Acetylsalicylic acid see Aspirin及Aspirin X Acetylsallcyllc acid。
2、属分参照:揭示词间上下等级关系,参照符号为see under(属)和XU(分)。例如Gamma Ray See under Radiation,Ionizing及Radiation,Ionizing XU Gamma Ray。 1991年后,所有次要叙词均升级为主要叙词,该参照被取消。
3、相关参照:揭示部分主题词之间意义上的相关关系。参照符号为\"see related(参见)\"和\"XR(反参)\"。例如Dental Caries see retated Cariogenic agents及Cariogenic agents XR Dental Caries,表示两个词间既非同义关系,也无属分关系,仅在概念上有一定的相关性。
(三)树状结构表(Tree Structures): 树状结构表是将主题词按照学科分类集中,反映的是主题词之间的概念上的逻辑隶属关系。字顺表反映词间的横向关系,树状结构表则显示词间的纵向隶属关系。两表以树状结构号互相沟通。将两表配合使用,可帮助检索者进行专指性检索和扩展检索。因为IM主题索引标引的一条重要原则是,尽量用最专指的MeSH词确切地标引文献。只有在该词尚未被确立为MeSH词时,才选用比它概念广的主题词标引。
(四)副主题词表(Subheadings)
副主题词的作用主要是限定主题词的范围,使主题词具有更高的专指性,缩小检索范围,加快检索速度。副主题词一般为外延比较泛的一些词,往往是对某一类事物的某一方面的概述,如对某种疾病的诊断、治疗,某种药物的治疗应用、副作用等。副主题词不能单独使用,必须与主题词组配在一起配合使用。目前副主题词共有82个,每个副主题词并不能与所有主题词组配。副主题词表对每一个副主题词的组配范围作了说明。
五、收录期刊一览表(List of Journals Indexed in Index Medicus)
一般由六个部分组成。以下是2002年\"收录期刊一览表\"的组成情况: (1)Journal Actions During 2001 (上一年期刊变动情况)
(2)Abbreviation Listing (刊名缩写表):帮助读者从刊名缩写查刊名全称。 (3)Full Title Listing(刊名全称表):帮助读者从刊名全称查刊名缩写。 (4)Subject Heading List(期刊主题表):按字顺列出127个期刊学科主题名称。 (5)Suject Listing(主题刊名表):按以上127个学科主题查找相关期刊。 (6)Geographic Listing (国别期刊表):按国家或地区查找收录期刊。
六、检索途径和方法
(一)主题途径
1.主题词的选择要遵循以下原则:(1)首选专指词,同时注意倒置主题词的使用,同义词、近义词的转换及主题词的增删、变更情况;(2)次选主副组配词;(3)再选上位词;(4)靠词检索。
2.副主题词的选择要注意以下问题:(1)隐含的副主题词;(2)副主题词组配范围的限定;(3)副主题词定义的。
3.注意配对选词:许多涉及到多个主题内容的课题,各主题概念间往往存在一定的关系,可采用配对选词的方式,将每组词都进入IM进行检索,比较其下的文献题录量,从量少的一组中再浏览筛选所需内容。以此方法来节省检索时间,提高检索效率。
4.注意配合使用树状结构表来选词:树状结构表按学科等级排列,可利用它选择某概念范围内的专指词,或者将某概念范围内的词选全。
(二)著者途径
当对某专业学科领域的某专家比较熟悉,想了解其最近研究的进展或新的成果,可通过著者索引来查找。其查找方法比较容易,但要注意著者的书写形式,对于同姓同名或同姓同名缩写的著者要根据题录内容或著者地址等进一步判断。
第四章 特种文献检索
主要知识点
第一节 专利文献及其检索
一、 专利(Patent)
(一)专利的概念:专利是指国家以法律形式授予发明人或其权利继受人在法定期限内对其发明创造享有的专有权。
(二)中国专利的类型:
1.发明专利:是指对产品、方法或其改进提出的新的技术方案。具有较高技术水平的发明创造,是专利法主要的保护对象。发明专利权有效期各国不同,我国为自申请之日起20年。
2.实用新型专利:是指对产品的形状、构造或其结合所提出的适合于实用的新的技术方案。是技术水平较低但实用价值较高,具有一定技术效果的小发明创造。在我国实用新型专利权有效期为自申请之日起10年。
3.外观设计专利:是指对产品的形状、图案、色彩或其结合所作出的富有美感,适于工业上应用的新设计。它不涉及技术上的发明创造。在我国外观设计专利权有效期为自申请之日起10年。
(三)授予专利权的条件:授予发明、实用新型、外观设计的专利,应当具备新颖性、创造性和实用性。
(四)专利的审批制度:大致上可归纳为以下几种:1.形式审查制;2.实质审查制;3.延迟审查制。
二、 专利法和知识产权
(一)专利法(Exclusive Law)
l.专利法含义:是国家制定的,用以调整因确认发明创造的所有权和因发明创造的利用而产生的各种社会关系的法律规范。
2.专利法的特征:国内法;特别法;实体法,也是程序法。
(二)知识产权(Intellectual Property)
即\"智力成果权\",是指科学、技术、文化艺术等领域从事智力活动而创造的精神财富所享有的权利。知识产权包括版权和工业产权,工业产权又包括专利、商标、服务标记、厂商
名称、货源标记、原产地名称等。知识产权具有以下三个特点:1.独占性;2.地域性;3.时间性。
三、专利文献与检索
(一)专利文献的概念、类型、特点与作用
1.专利文献的概念:是实行专利制度的国家、地区及国际性专利组织在审批专利过程中产生的官方文件及其出版物的总称。
2.专利文献的种类:(1)按法律性质分为申请说明书和专利说明书两种。(2)按技术内容分为发明专利说明书、实用新型专利说明书和外观设计文件。(3)按加工层次分为专利说明书;专利文摘、索引、题录、公报等;专利分类表、分类表索引等。
3.专利文献的特点:(1)提供经济、技术和法律信息;(2)内容新颖、范围广泛;(3)内容详尽、可操作性强;(4)出版迅速,重复量大;(5)分类和检索方法特殊。
4.专利文献的作用:(1)法律作用;(2)技术指导作用;(3)经济作用。
(二)专利文献检索工具和检索方法:
1.专利文献主要检索工具:包括期刊;图书;报纸;商品、样本等。
2.专利文献数据库:包括英国德温特公司出版的数据库;美国 DIALOG系统;美国ORBIT系统;中国专利文摘(Chinese Patent Abstracts in English);因特网上的专利文献数据库系统。
3.专利文献手工检索方法:主要途径有专利号途径和专利权人途径等。
四、国际专利分类法
国际专利分类表(International Patent Classification,简称IPC表)是使用国际专利分类法的工具。IPC既可表示国际专利分类法、国际专利分类表,也可表示国际专利分类号。 1.IPC表结构编排:IPC表采用等级形式,将技术内容按部(Section)、分部(Subsection)、大类(Class)、小类(Subclass)、主组(Group)、分组(Subgroup)逐级分类,形成完整的分类体系。一个完整国际专利分类号由部、大类、小类、主组或分组的类号组成。
2.国际专利分类法分类的原则:(1)国际专利分类法力图保证任何与发明有关的技术主题能尽量作为一个整体来分类,而不是将它的各组成部分分别分类;(2)对于发明专利按照功能性发明和应用性发明来分类;(3)发明技术主题的分类:有化合物、化学混合物或组成物、化合物的制备或处理、设备或方法、制造的物品、多步骤方法与设备、零件与结构部件。
3.国际专利分类法的分类规则:(1)优先规则; (2)最后位置规则;(3)主要成分规则。
五、中国专利文献及其检索
1.中国专利文献检索工具:
① 公报类:《发明专利公报》、《实用新型专利公报》、《外观设计专利公报》三种; ② 索引类:《中国专利索引》,又包括《分类年度索引》和《申请人、专利人年度索引》;
③ 通报类:《中国专利文献通报》;
④ ④其它:《中国专利分类文摘》、《中国专利报》等。 2.中国专利文献的检索方法:
主要可以从国际专利分类号、专利号、专利权人等几个途径去查找。如果检索某课题的
专利,首先要确定该课题的国际专利分类号;由专利权人或发明人检索有关专利,选用申请人、专利权人索引途径进行检索。
六、德温特专利及其检索方法
(一)德温特专利
德温特专利是英国德温特公司(Derwent Publication Ltd.)的出版物,它分两大系统,即分国专利文摘系统和世界专利索引。《世界专利索引》是最常用的专利文献检索工具,其特点为:报道速度快;报道的国家多、收录范围广泛;语种单一,出版形式多样,适用面广;检索方法和手段灵活。《世界专利索引》又分《世界专利索引题录周报》和《世界专利文摘周报》两种。
(二)《世界专利索引题录周报》(World Patent Index Gazette,简称WPIG)
《题录周报》是以题录形式报道专利文献的检索工具。它有四个分册,每个分册都包括四种索引:专利权人索引、国际专利分类索引、登记号索引、专利号索引。其检索途径有:专利权人途径、国际专利分类途径、登记号途径、专利号途径。
(三)《世界专利文摘周报》(World Patent Abstracts Journal,简称WPAJ)
《文摘周报》是专利文献检索周刊,与《题录周报》三个分册中的题录相对应。现在包括P1-P3、P4-P8、Q1-Q4、Q5-Q7四个分册的内容。电气类S-X三个分册停刊。其检索途径有:分类途径、专利权人途径、登记号途径。
第二节 标准文献及其检索
一、标准文献的概念、类型、特点
(一)标准文献的概念 一般是指由技术标准、管理标准及其它具有标准性质的类似文件所组成的一种特定形式的科技文献体系,包括标准(standard)、规范(specification)、规程(displine)、标准草案(rough draft)和技术要求(requirement)。
(二)标准文献的类型
(1)按照其在国民经济中的作用和性质分为:技术标准和管理标准;
(2)按照标准化对象的特征可以分为四大类:基础标准、产品标准和技术条件、方法标准、安全与环保标准;
(3)按照使用范围可以分为四大类:国际标准、区域标准、国家标准、行业标准; (4)按照内容可分为:基础标准、产品标准、方法标准、安全与环境标准、经济管理标准、行政管理标准等;
(5)按照成熟程度可分为:法定标准、推荐标准、试行标准、标准草案。
(三)标准文献的特点
标准文献是一种特殊文献,除了具有科技文献的特点,还有其自身特点:1.权威性;2.规范性;3.法律性;4.协调性;5.时效性;6.标准文献之间是相互引用或交叉重复。
二、国内标准文献的检索
(一)标准化文摘
标准化文摘以文摘、简介和题录形式报道国内有关标准化方面的文献。它按照我国国家标准GB3793-83《检索期刊条目著录规则》中的规定,采用标准著录格式;每期附有分类索引,分类索引采用《中国图书资料分类法》(第三版)标引;每年第四期附有主题索引,主题索引采用《标准文献主题词表》,并参照了《汉语主题词表》进行标引。
(二)国内标准文献的检索途径:标准号途径;分类途径;主题途径。
(三)国内标准文献的计算机检索:
国内标准信息源的网址有:①中国标准化网(http://www.csbts.cn.net);②中国标准服务网(http://www.cssn.net.cn/vercha.htm);③中国质量信息网(http://www.cqi.gov.cn) 。
三、国际标准文献的检索
(一)国际标准文献的检索工具刊 (1)《ISO国际标准目录》(ISO CATALOGUE原文版、中文版); (2)《IEC国际标准目录》(原文版、中文版) (3)《27个国际组织标准目录》(中文版)
(4)《各国标准对照手册》(中文版) (二)国际标准文献的检索方法
(1)手工检索:按照标准号途径、分类途径、主题途径来查找所需的文献信息。 (2)计算机检索:进入相关的标准信息数据库网站,查找所需信息。 (三)国际标准文献主要网址
国际标准信息源网址有:①1.国际标准化组织(ISO)(http://www.iso.ch);②国际电工技术委员会(IEC)(http://www.iec.ch);③美国国家信息组织(NISO)(http://www.niso.org)。
第三节 科技报告及其检索
一、科技报告的概念和特点
科技报告是科学研究的正式成果报告,或是某项课题研究过程某一阶段进展情况的实际记录。
科技报告的特点:1.无固定出版周期;2.出版发行不规则;3.不公开发行;4.科技信息含量大。
二、美国四大科技报告
1.PB报告
PB是美国商务出版局(U.S.Department of Commerce Office of Publication Board)的简称。这些资料都编有流水号,并在流水号的前面加有\" B\"字样,故称之为PB报告。
2.AD报告 AD是ASTIA Document的简称。ASTIA是指美国武装技术信息总局(Armed Service Technical Information Agency)。该局搜集、收藏的国防科技报告统称为AD报告。ASTIA现更名为美国国防科学技术信息中心(Defence Technical Information Center,简称DTIC)。AD报告采用\"AD十密级十流水号\"的报告号。
3.NASA报告
NASA是美国国家航空与航天局(National Aeronautics and Space Administration)的简称。由NASA出版的科技报告称为NASA报告。NASA报告采用\"NASA十报告出版类型十顺序号\"的报告号。
4.DE报告
DE是美国能源部(Department of Energy)的简称。由该部所出版的报告称为DE报告。该报告主要报道原子能及其开发应用,另外也报道与能源有关的科技报告。
三、《报告通报与索引》及其检索方法
《报告通报与索引》(Government Reports Announcement & Index,简称GRAI)是由美国NTIS编辑出版的摘要式检索刊物,它全面报道美国四大科技报告,重点报道NASA和DE报告。
GRAI正文按照NTIS的主题分类的类名次序编排,有38个大类,在每个大类下又有不同的小类。检索方法:1.按类目名称查找;2.按关键词索引顺序查找;3.按个人著者索引顺序查找;4.按团体著者索引顺序查找;5.按合同号索引顺序查找;6.按NTIS订购号/报告号顺序查找。
四、科技报告的网上检索
检索科技报告的常用网站主要有:
1.联合国及其专门机构站点(http://www.unsysten.org);
2.联合国哈马舍尔德图书馆网址(http://www.un.org/Depts/dhl); 3.耶鲁大学图书馆(http://www.library.yale.edu/un/unhome.html);
4.国际组织网站信息指南(http://www.library.nwu.edu/govpub/idtf/igo.html); 5.美国商务部国家技术情报服务局(http://www.ntis.gov); 6.中国信息网站(http://www.gov.cn)。
第四节 学位论文及其检索
一、 概述
1、定义:是指高等学校或科研单位的毕业生为取得学位资格而撰写的学术性研究论文。学位论文的特点是专业性、知识性、独创性。 2、学位论文的主要检索工具:
①《国际学位论文摘要》; ②《硕士学位论文摘要》:③《英国和爱尔兰大学学位论文索引》;④《加拿大学位论文》;⑤《法国高等院校博士论文目录》;⑥《中国学位论文通报》。
二、《中国学位论文通报》及其使用方法
《中国学位论文通报》由中国科学技术情报研究所编辑,科学技术文献出版社出版发行。内容涉及自然科学领域各个专业的硕士、博士和博士后全部论文书目信息。它按《中国图书资料分类法》分类号的顺序编排学位论文题录,可按分类途径查找所需文献,按馆藏索取号向中国科学技术情报研究所借阅。
三、《国际学位论文摘要》及其使用方法
《国际学位论文摘要》主要报道美国和加拿大500多所大学的博士论文,还报道100多所欧洲大学及少量其它国家的论文。该刊分为A、B、C三辑出版,其中B辑涉及生命科学,主要由类目、文摘和索引三部分组成。每个类目都按主题字顺进行排列,并指引其所在的页码。文摘按分类编排,正文前有小类目名称。索引有关键词索引和著者索引。读者可以根据自己检索的情况,利用分类类目、著者索引和题目关键词索引三条途径进行检索。
第五节 会议文献及其检索
一、会议文献的概念、功能和类型
是指各学术研究机构的科技人员在各专业会议上宣读的论文和报告。特别是国际性会议和全国性会议,一般提交的论文都是经过挑选的学术性比较强、内容比较新颖的。
功能:1.信息库的功能;2.导向功能;3.综合功能。
类型: 按会议规模分为国际性会议文献、全国性会议文献、地区性会议文献和基层会议文献;按产生的过程分为会前文献、会中文献、会后文献。
二、国内会议消息和会议文献的检索工具和检索方法
国内会议文献主要检索工具有: 1.《中国学术会议文献通报》:由中国科学技术情报研究所出版。 2.《中文科技资料目录》(医药卫生):中国医学科学院医学信息研究所编辑出版。 3.《中国国防科技报告通报与索引》:中国国防科技信息中心编印。 4.《中文科技文献目录》:上海科技情报研究所编印。
会议文献检索方法:1.通过会议录查找;2.通过期刊查找;3.通过会议录馆藏情况查找。
三、国外会议消息和会议文献检索工具和检索方法
(一)《世界会议》及其检索方法
《世界会议》(World Meetings,简称WM)由美国世界会议出版社(World Meetings Publications)编辑,Macmill Publishing Co.出版。它预告两年内将要在全世界100多个国家和2000多个地区召开科学、技术、医学方面的国际会议有关消息。它提供四种分册、六种索引。正文部分按会议登记号和开会日期排列。其检索方法:主要根据关键词索引、日期索引、地址索引、出版信息索引、截止日期索引、主办机构目录和索引来查找正文内容。
(二)《科技会议录索引》及其检索方法
《科技会议录索引》(Index to Scientific &Technical proceedings,ISTP)创刊于1978年,月刊。由美国科学情报研究所编辑出版,报道内容涉及基础科学、工程技术及应用科学、临床医学、生命科学、农业、生物及环境科学、毒理学等。每期包括正文和6个索引。正文部分按照收集会议录的先后次序进行编排。其的检索方法:按分类索引、编著者索引、主办单位索引、会议地址索引、轮排主题索引、机构团体索引查找所需要的学术会议文献信息。
(三)《会议论文索引》及其检索方法
《会议论文索引》(Conference papers Index)由美国数据快报公司(Data Courier Inc)编辑,
美国坎布里奇科学文摘社出版。报道全世界近期召开过的科技会议论文。正文部分将收录的全部学术论文按学科专业分为18个类目,类目表按照字顺排列。索引部分只有主题索引和著者索引。其的检索途径主要有分类途径、主题途径、著者途径、会议日期途径和登记号途径。
第五章 美国《科学引文索引》
主要知识点
第一节 《科学引文索引》概况 一、《科学引文索引》简介
《科学引文索引》(Science Citation Index,简称SCI)是一部题录式的综合性大型科技文献检索刊物,由美国费城Institute for Scientific Information(科学情报研究所,简称ISI)编辑出版发行。1961年开始编制,1963年编成出版,最初为年刊,1966年起改为季刊,1979年起至今为双月刊。SCI收录有期刊论文、会议摘要、综述、讨论,以及The Scientist、Nature、Science等杂志所发表的书评。SCI主要报道生命科学、医学、行为科学、物理、化学、工程技术、天体地学等94个科学领域的引文著者的论文被引用情况和来源著者发表论文情况。SCI对生命科学、医学领域有所侧重。SCI每期分册出版,分别刊载各种索引,SCI每年出版累积索引。
二、SCI的作用
1.对引文及引文作者的评价作用。
2.对期刊学术水平和影响力的评价,为选择和确定核心期刊提供依据。 3.在相近课题同行之间的桥梁作用。 4.对科研动态的分析作用。
第二节 SCI的结构编排与著录格式
一、SCI的结构编排
对一篇附有引文即参考文献的论文而言,存在着引用著者和被引用著者。一篇论文的原始著者,由于他引用了别人的文献,SCI称之为引用著者(Citing Author)或来源著者(Source Author),而对于被引文献的著者,SCI称之为被引著者(Cited Author)。刊载原始著者所写文章的期刊称为来源期刊(Source Journals)或来源出版物(Source Publications)。
(一)引文索引(Citation Index)
1.著者引文索引(Author Citation Index):该索引反映著者的论文被他人引用情况的一种索引,按引文著者姓名字顺编排,姓在前用全称,名在后用首字母,若引文著者不止一个,则只列第一著者;同一著者的各篇引文再按发表时间的先后顺序排列,其后列出各引文的出处;每一篇引文下列出来源文献的第一著者姓名及出处;同一引文下,按来源著者姓名字顺排列。
2.团体著者引文索引(Corporate Author Citation Index):该索引按引文团体著者的机构名称缩写排列。同一团体著者机构名称下,按引文文献出版物名称缩写字顺排列;同名出版
物,按各篇引文发表时间先后顺序排列;同一引文下,按来源著者姓名字顺排列。 3.匿名引文索引(Citation Index: Anonymous):该索引收录来源文献中未注明引文著者姓名的文献,按引文出版物名称缩写字顺排列,同名出版物按出版年、卷先后顺序排列;无著者又无发表年代的引文,按该文献的出版物名称缩写或报告号顺序排在该索引的最前面。
4.专利引文索引(Patent Citation Index):该索引收编以专利说明书为引文,按专利号数字由小到大的顺序排列,其下列出该专利公布的年份、专利发明人及专利国别,以及来源文献的著者姓名及出处;同一专利号下,按来源著者姓名字顺排列;同一来源著者下,按来源文献出版物名称缩写字顺排列。该索引用来检索某些专利被他人引用情况和来源文献的出处等。
(二)来源索引(Source Index):
1.团体索引(Corporate Index):该索引按来源著者所属国家、城市、机构名称的字顺排列。
(1)地理部分(Geographic Section):该部分按著者工作单位所在地的地名字顺排列。
(2)机构部分(Organization Section):该部分按机构名称字顺排列。 2.来源著者索引(Author Index):该索引是将引文索引中所列的所有来源著者姓名(包括合著者姓名)按字顺逐条排列。
(三)轮排主题索引(Permuterm Subject Index) 该索引是由主要词(primary term)、配合词(co-term)和来源著者姓名三项组成。按主要词字顺排列的。
(四)来源出版物一览表(Lists of Source Publications)
位于引文索引(A册)和来源索引(D册)的前面,该表收编当期SCI收录的所有来源出版物(包括期刊、专著、丛书以及当期新增的刊物)。
二、SCI著录格式
SCI著录格式包括引文索引著录格式、来源索引著录格式和轮排主题索引著录格式。
第三节 检索途径及应用举例
一、引文途径
1.著者引文途径
欲了解或评价某位学者的学术水平、科研成果、在某学科上所作的贡献及在国际上的知名度等,可通过引文索引查找该专家的姓名及其论文被人引用的情况。
2.专利引文途径
若查找某一专利的引用情况,可以利用专利引文索引途径。
二、来源著者途径
在来源著者索引中,利用著者姓名可查清楚某著者发表的文献题目、出处(期刊名称、年份、卷次、期号、页码)及著者的国别和单位。
三、团体索引途径
若想了解某科研机构科研人员发表的论文被SCI收录情况,可利用团体索引进行查找。
四、主题途径
如果想了解某一研究课题的文献,可利用关键词从轮排主题索引进行查找。
五、综合途径
利用SCI检索文献时,可根据课题需要,选择不同途径进行检索,也可将上述几种途径结合起来,配合使用。
第六章 计算机检索概论
主要知识点
第一节 计算机检索发展史
计算机用于信息检索的研究始于20世纪50年代初。
60年代中期,人们主要利用单台计算机输入输出装置进行过期文献的回溯检索和新文献的定题检索,提供脱机检索服务。70年代初,计算机检索进入联机检索阶段,单台贮存信息的主机可通过通信线路联接多个检索终端,利用分时技术,多个用户可以同时与主机\"对话\"--即检索文献。进入80年代以后,计算机信息检索进入信息一计算机一卫星通信三位一体的新阶段--国际联机信息检索阶段,使信息、文献不受地区、国家而真正实现全世界信息资源共享的目的。到了80年代末、90年代初,计算机信息检索发展成计算机网络检索系统。同一时期,用光盘制成的数据库取代了一部分联机检索的市场。
Internet上提供联机信息检索服务的数据库已从文献型逐步过渡到数值型和事实型数据库,而且全文型数据库也开始不断增加;数据库内容的存贮形式向多媒体方向发展,从单纯的字符模式过渡到图文并茂的图形方式,在不久的将来,还会提供大量实时的声音和动画的文献存贮模式。
第二节 计算机检索的基本原理
计算机信息检索是利用计算机对信息进行存储与检索的过程。计算机信息检索系统的构成从广义上讲包括信息存储和信息检索两个方面。在计算机信息检索中,信息存储和信息检索具体来讲也就是数据库的建立与利用两个方面。
-、数据库的建立
建立数据库是指按照既定的建库方针、目的、标准等从信息源中选择所需文献,对需录入的文献进行加工,也就是对文献的外表特征和内容特征进行分析和标引,形成文献特征的标识,把这些标识输入计算机,计算机再按事先设计好的规则自动把这些标识排序形成多种索引,建成数据库,为信息检索提供有规可循的检索途径。
文献存储时,首先要对原始文献的内容深入理解,进行主题分析,把握住它所论述的中心内容,形成主题概念,然后选用特定的情报检索语言(即词表或分类法)来表达其主题概念,转换成系统语言,形成文献特征标识(主题词、分类号和类目名称等),这一过程就是通常所说的文献的\"标引\"。最后将这种标引后形成的特征标识按其内容和出处输入计算机排序,建成数据库。每一种文献特征在计算机中称为\"字段\",文献特征标识就是字段值,所有的文献特征(字段)即构成一篇文献的题录或文摘(记录)。
将数据库中全部记录按一定顺序排列而成的文献记录集合就构成数据库的顺排文档;而将这些记录的全部文献特征标识按一定顺序排列而成的集合就构成数据库的倒排文档。顺排文档存入了数据库的全部记录;倒排文档则存入了数据库全部记录的文献特征标识(即索引单元)。
二、数据库的利用
数据库的利用,即信息检索的过程,是计算机信息存储的逆过程。检索之初,先要深入分析检索课题的核心内容,再将课题的主题概念按系统词表进行规范化处理,转换成系统语言,形成检索提问特征标识,根据需要使用布尔逻辑(and、or、not)等运算符制定好检索策略(检索提问式),将检索提问式输入计算机,在数据库中查找所需信息。
在检索过程中,如果检索提问式只有一个主题概念,那么计算机就直接根据这个主题概念所对应的提问特征标识在数据库中的倒排文档中进行搜索、类比、匹配,得到相对应的文献特征标识后,再根据该标识后的文献存取号,在顺排文档中找到相对应的文献,即是所需要的检索结果;如果检索提问式是带有逻辑运算的多个主题概念的复杂检索式,那么计算机就会首先在数据库的倒排文档中找到这些主题概念所对应的文献特征标识,再根据布尔逻辑运算符的要求,对这些文献特征标识后的记录存取号集合进行比较、匹配、取舍,实现多个文献特征标识的逻辑运算,运算结果得到符合要求的记录存取号,根据这些存取号在顺排文档中找到的相应记录(文献)即是最后的检索结果。用户可根据计算机输出的检索结果的反馈信息来修改检索策略(检索提问式),以期得到最满意的结果。
总之,计算机检索的基本原理,就是通过一定的方法和手段,使计算机信息存储与信息检索两个过程所采用的特征标识达到高度一致,以便有效地获得和利用原始文献。这两个过程是相辅相成的。
第三节 文献信息数据库的基本概念
一、数据库的定义和类型
数据库是在计算机存储设备上按一定方式存储的相互关联的数据集合。数据库的质量直接影响信息检索系统的功能和效率。按照国际上通用的分类方法,数据库通常划分为以下类型:
(一)参考数据库(Reference Databases)
参考数据库是指引用户到另一信息源以获得原文或其它细节的一类数据库。它包括书目数据库和指南数据库两种。
1.书目数据库(Bibliographic Databases):指存储某个领域的二次文献(如文摘、题录、目录等书目数据)的一类数据库,有时又称为二次文献数据库,或简称文献数据库。
2.指南数据库(Reference Databases):存储关于某些机构、人物、出版物、项目、程
序、活动等对象的简要描述,指引用户从其它有关信息源获取更详细的信息的一类数据库。也称指示性数据库。
(二)源数据库(Source Databases)
源数据库是能直接提供原始资料或具体数据的数据库,用户不必再查阅其它信息源。它又可以划分为以下几种类型:
1.数值数据库(Numeric Databases):指专门提供以数值方式表示的数据(或包括其统计处理表示法)的一种源数据库。
2.事实数据库(Fact Databases):指专门提供事物发展过程中产生的事实数据的一种源数据库。这类数据库一般同时提供文本信息和数值数据。
3.全文数据库(Full Text Databases):指存储文献全文或其中主要部分的一种源数据库,简称全文库。
4.术语数据库(Terminological Databases):指专门存储名词术语信息、词语信息以及术语工作和语言规范工作成果的一种源数据库。
5.图像数据库(Graphics Databases):指用来存储各种图像或图形信息及有关文字说明资料的一种源数据库。
另外,还可将数据库按其载体不同分成磁媒体数据库、光盘数据库和多媒体数据库。
二、数据库的结构
从用户的角度来看,数据库主要由文档、记录、字段三个层次构成。 1.文档(File):若干个逻辑记录构成的信息集合称为文档。
2.记录( Record):记录是由若干字段组成的文献单元,是计算机检索系统存储文献条目和标引的信息载体,每条记录记载了一篇文献的外部特征和内容特征。
3.字段(Field):字段是构成记录的基本单元,是对实体的具体属性进行描述的结果。在书目数据库中,记录中含有题名、著者、出版年、来源、主题词、文摘等字段。
第四节 计算机检索方式
-、脱机检索(Off-Line Retrieval)
脱机检索又称批式检索,是指检索者直接在计算机旁进行文献检索的一种方式,在此方式中,用户只需要把检索要求送往检索中心,由专职操作计算机的人员(即检索者)进行检索。因此这种检索不要求太高的技术条件,成本也较便宜。脱机检索方式往往把一批检索提问集中起来,对提问不立即回答,而是定期成批地在计算机上查找,即批处理方式。
脱机检索由于种种缺陷,已于20世纪60年代末、70年代初渐渐停止使用,脱机检索系统逐步转化成联机检索系统。
二、联机检索(Online Retrieval)
联机检索是指信息用户使用终端设备(包括终端或兼用微机、调制解调器和打印机),运用一些规定的指令输入检索词和检索策略,通过通讯网络与相关信息检索系统的计算机直接连接进行\"人机对话\",同时通过运行检索软件从信息检索系统的预先储存文献的数据库中查找所需信息的过程。
联机检索的优点:1.克服了地理上的障碍,极大地提高了信息的可获性;2.消除了时间上的延迟现象,可以马上得到检索结果;3.保证检索者获得最新、最及时的文献信息;4.\"人机对话\"方式可使检索者随意修改检索策略,从而达到很高的查全率和查准率。
联机检索的缺点:1.检索费用较高;2.受地区通讯线路质量的影响较大;3.检索技术较为复杂,难以成为普及型的检索手段。
三、光盘检索(CD-ROM SEARCHING)
微机、检索软件、光盘驱动器和光盘数据库即构成光盘检索系统。
光盘检索的优点是:①使用方便、简单,易于操作;②不受机时的,可反复修改检索策略,达到很高的检全率与检准率;③检索费用低廉,没有通讯费用,一次订购,反复使用。
光盘检索的缺点是:①数据更新周期较慢,时差长,文献的新颖性不够;②同一时间只能一人使用,资源浪费较大。但是,现在的光盘网络技术已经解决了这一问题。
四、网络信息检索(NETWORK SEARCHING)
互联网的发展使人类社会信息的存储、传递、交流和利用发生了性的变化,世界变小了,实现了全球通讯和资源共享。互联网上的信息资源呈现爆炸性增长,传统的相对的联机检索系统纷纷变成了互联网上的一个站点,计算机检索进入了网络信息检索阶段。网络信息检索是计算机信息检索发展的最高阶段。
第五节 计算机检索步骤与方法
计算机信息检索的基本步骤应包括分析课题确定主题概念、选择检索方式和数据库、确定检索途径、编制检索策略(检索式)、检索策略的反馈调整和检索结果的输出等几个方面。
一、分析课题确定主题概念
对待检课题进行深入的分析,找出课题中包含的主要概念以及明确最终的检索目的是检索能否成功的关键。提炼关键技术和主要概念并明确这些概念之间的关系是检索的第一步。把概念分析的结果用自然语言的词或词组表达出来,以便下一步制订检索策略。明确课题的检索目的就是要弄清最终的检索结果是求新、求准还是求全。最后,还要明确所需信息的类型是文献型、还是数值型、事实型;是全文型,还是文摘型;是专利文献,还是一般资料。
二、选择检索方式和数据库
在检索之前阅读有关数据库的使用介绍,以便选择数据库时做到心中有数。一般来说,网络数据库的数据更新速度要比光盘数据库快得多,因此,当需要查找最新文献信息时,应尽可能采用联机检索或网络信息检索方式,在网络数据库中搜索,如果没有合适的网络数据库,也应选择数据更新周期短的光盘数据库。当需要做年限跨度较大的回溯检索时,为了节省费用,应尽可能选用相关的光盘数据库。另外,不同的数据库检索指令、检索语法和规则也不尽相同,应预先熟悉和了解;还要弄清所选数据库的标引规则和词表系统,为确定检索
途径作准备。
三、确定检索途径
在选择合适的数据库之后,还应根据待检课题的检索目的和要求,确定检索途径。常用的检索途径包括分类途径、主题途径、著者途径和符号途径等。
常用检索词有两种:一种是主题词,另一种是自由词。主题词是来源于系统词表并经过规范化处理的检索词,使用主题词检索可保证较高的查全率和查准率。自由词则由用户根据检索课题需要所提出的词,一般选自用户查阅的文献资料,是一类没有规范化的检索词。
四、编制检索策略(检索式)
编制检索策略(检索式)是指在正确分析课题主题的基础上,把选择好的检索词或检索标识按检索系统规定或允许的运算符或检索规则连接起来,形成检索策略(检索式),并提交计算机检索系统进行处理的全过程。检索系统中常用的运算符或检索规则包括以下几个方面:
(一)布尔逻辑运算符
布尔逻辑运算符是为了表达检索词之间的逻辑关系的算符,包括逻辑\"与\"、逻辑\"或\"和逻辑\"非\"三种类型,分别用and、or和not表示。用布尔逻辑运算符连接检索词形成的检索式称为布尔逻辑检索式。布尔逻辑检索式是计算机信息检索中最常用的检索表达式。
在一个检索式中,可以同时使用多个逻辑运算符,构成一个复合逻辑检索式。在复合检索式中,还可采用优先处理算符 \"()\"(即括号)。各种运算符的优先级依次为:()>not>and>or。
(二)位置算符
位置算符又称邻近度算符,是逻辑运算符and的延伸,适用于两个检索词在同一篇命中文献中需要指定间隔距离或出现顺序的检索表达式。按照两个检索词出现的顺序和距离,可以有多种位置算符,而且对同一位置算符,检索系统不同,规定的位置算符也不同。 (三)字段限定符
将检索词在文献特定字段中出现的检索称为限定字段检索。限定字段检索的目的是为了进一步减少输出结果,缩小检索范围,提高检索结果的查准率。实现限定字段检索的运算符称为字段限定符,常用的有\"in\"和\"=\"。
(四)截词算符
截词检索是指截取检索词中的一部分进行文献检索的方式。截词方式有后截断(前方一致)、前截断(后方一致)、前后截断(中间一致)和中间截断(中间屏蔽)等四种方式。
五、检索策略的反馈调整
检索策略(检索式)输入检索系统之后,初步检索出的结果有时不一定能满足课题的要求,这时就需要调整检索策略。调整检索策略一般按查全和查准两个原则进行。
当检索结果太多,且查准率较低时,检索式可作如下调整:1.减少同义词或同类相关词;2.提高检索词的专指度,尽量采用专指性强的主题词或自由词;3.增加概念,用逻辑\"与\"(and)将它们连接起来;4.使用限定字段检索,把检索词限定在题目、主题词等主要字段;5.使用适当的位置算符,排除误检,提高查准率;6.减少检索年限,检索结果的文献类型(如综述)、语种及出版国,或限定在核心期刊检索。
当检索结果太少,查全率较低时,应从扩大检索范围入手,检索式可作如下调整:1.增加同义词或同类相关词,并用逻辑\"或\"连接这些词;2.降低检索词的专指度,可从词表或检出文献中选择上位词或泛指词补充到检索式中;3.减少概念,少用and运算符,删除一些非关键的检索词;4.进行扩展检索(族性检索),根据词表的分类结构体系扩展关键的检索词;5.取消某些过严的字段、位置算符(或者改用程度较小的位置算符);6.增加回溯检索年限。
如有必要,应对检索式进行多次的反馈修改和调整,直到检索结果满意为止。
六、检索结果的输出
当检索结果符合检索课题的要求和目的时,可以输出最终的检索结果。检索结果的输出是计算机检索步骤的最后一步。
第七章 光盘数据库检索
主要知识点
第一节 光盘及光盘检索
一、光盘的概念
光盘是一种用激光技术在特制的圆盘上记录和再生信息的介质,是一种不同于磁性载体的光学存储器。光盘存储技术发展到现在已有三种类型:
1.只读光盘:即CD-ROM(Compact Disc-Read Only Memory),又称为高密度光盘只读存储器,是第一代光盘。一旦信息录入,只能读出,不能修改。
2.写读光盘:即CD-R(CD Recordable),这种光盘可以由用户写入信息,一旦信息录入,就不能重写或修改,属于写后只读光盘,是第二代光盘产品。 3.可擦写光盘:即CD-RW(CD Rewritable),同磁盘一样,可以随机存取数据和信息。这类光盘已完全商品化,属于第三代光盘。
二、光盘的特点
存储容量大;读取速度快;稳定性好,坚固耐用;使用寿命长;使用方便
三、光盘数据库
光盘数据库是指利用光盘为载体实现的数据库。
目前国内常用的生命科学方面的光盘数据库有以下几种:MEDLINE、EMBASE、Biological Abstracts、Chemical Abstracts、International Pharmaceutical Abstracts、SCI、JCR、CBMdisc(《中国生物医学文献数据库》)、CMCC(《中文生物医学期刊数据库》)、CPA(《中国药学文摘数据库》)。
四、光盘检索系统
利用光盘数据库作为信息源建立起来的计算机信息检索系统称为光盘检索系统。光盘检
索系统根据建立的方式不同可分为:单机光盘检索系统和光盘网络信息检索系统。
五、光盘检索与联机检索的关系
在通常情况下,如果希望获得较高的查准率和查全率,可以针对检索课题,先选择相关的光盘数据库进行检索,在对该课题文献分布情况有了充分了解,并确定了正确而合适的检索策略以后,再进行联机检索,效果较好。
第二节 MEDLINE光盘检索
本节主要介绍用银盘公司的检索软件WinSpirs检索MEDLINE光盘数据库的方法与技巧。
一、WinSpirs简介
WinSpirs是美国银盘公司基于Windows平台开发的,适用于该公司所有光盘数据库的专业信息检索软件。WinSpirs的含义是SilverPlatter Information Retrieval System for Windows。WinSpirs是一个用户界面友好的易操作软件。它的检索功能强大,检索文献时,提供多种检索入口和检索方案,给用户以很大的自由度和灵活性,查全率与查准率较高。
二、MEDLINE光盘数据库及其结构
MEDLINE是美国国立医学图书馆(National Library of Medicine, NLM)编辑出版的国际综合生物医学信息书目数据库。它的内容涵盖三种重要的纸本医学文献检索工具:《Index Medicus》(医学索引),《Index to dental Literature》(牙科文献索引),《International Nursing Index》(国际护理索引)。它收录了1965年以来世界70多个国家和地区出版的大约3900余种生物医学核心期刊的文献题录和文摘。涉及的主要学科领域有:基础医学、临床医学、护理学、口腔医学等。
目前,银盘公司出版的MEDLINE光盘数据库是我国医学相关部门进口数量最大,使用频率最高的医学文献光盘数据库,数据更新周期为月更新。
三、WinSpirs主要界面
1.数据库选择屏与数据库版权页
WinSpirs首先出现的画面是\"数据库选择屏\",供用户选择实际检索MEDLINE数据库的时间范围。按OK予以确认后,WinSpirs将显示MEDLINE的\"版权页\"对话框(见图7-2),该屏显示了MEDLINE数据库的时限、简介和版权信息。
2.检索屏
检索屏是WinSpirs最主要的界面,主要的检索途径和过程都在此画面下完成。 3.索引屏
索引屏列出了数据库中所有可以检索的词、词组或字母数字的组合,它允许用户用词根查找某一个单词或词组,并浏览包含这些词的所有记录。 4.叙词屏
叙词屏是进行主题词检索的主要界面。主题词检索可以使检索结果既全面又准确,达到
较高的查全率和查准率。
四、用WinSpirs检索MEDLINE数据库的方法与技巧
(一)自由词检索
自由词检索可以在三种状态下实现: 1.检索屏 Search: 提示符后
在 Search: 提示符后,可输入任意一个检索式开始检索,检索式可以是: (1)任意的字母或数字组合,如:123,abc,3m等。
(2)任意的单词或词组(禁用词除外),如:cancer;hepatitis a virus;AIDS; alpha adrenoceptor
(3)连缀词组,如:Interleukin-6; drug-abuse
(4)词根(截词)检索,如:comput*;cardi* (*为截词符,代表任意个字母) (5)以前的检索式序号,如:#6
(6)逻辑检索式:用逻辑运算符连接检索词形成的检索式就是逻辑检索式。WinSpirs提供以下几个逻辑运算符进行逻辑复合检索。
A.逻辑\"与\"运算(AND):检索式写成A and B,表示文献中同时包含检索词A和检索词B的文献才是命中文献。
B.逻辑\"或\"运算(OR):检索式写成A or B,表示包含检索词A的文献或者包含检索词B的文献或者同时包含检索词A和B的文献为命中文献。 C.逻辑\"非\"运算(NOT):检索式写成A not B,表示包含检索词A同时不包含检索词B的文献为命中文献。
D.邻近度算符(WITH):逻辑\"与\"运算符AND的延伸,检索式写成A with B,表示检索词A和检索词B不仅要同时出现在一条记录中,还要同时出现在一个字段里的文献才是命中文献。
E.邻近度算符(NEAR):邻近度算符WITH的延伸,检索式写成A near B,表示检索词A和检索词B不仅要同时出现在一条记录的同一字段里,还必须在同一个子字段(一句话)里的文献才是命中文献。
F.邻近度算符(NEAR#,\"#\"代表一个常数):邻近度算符NEAR的延伸,检索式写成A near# B,表示检索词A和检索词B之间有0~#-1个单词的文献(A和B在同一记录、同一字段里)。在near后加一个数字,指定两个词的邻近程度,且不论语序。
在复合检索式中,括号的运算优先级最高,not,near,with,and次之,or最低。 (7)带通配符的单词,例如:Colo?r可检索Color或Colour的文献,\"?\"表示0或1个字母。
(8)带引号的运算符或禁用词的检索,例如:\"near\"death experience(临终关怀)。 2.命中结果显示区内
如果在浏览已检到的检索结果时,发现文中有更好的,更确切的词,那么用户可以通过鼠标加亮该词或词组,按 按钮送到检索提示符Search:后进行检索。这种从显示的记录中选词检索也称为横向检索。在横向检索中,选择的短语长度不超过140个字符。
3.索引屏状态下
索引屏所展现的是MEDLINE数据库的基本索引,又称主要倒排档。它列出了MEDLINE数据库中全部记录的所有可以检索的词、词组或字符组合。在索引屏状态下,用户可以按字顺查看数据库中所有被索引的词及用连字符连接起来的术语,并允许从中选择一个或多个词进行自动检索,也可以在Index:提示符后输入一个特定的词或词根,索引会自动停留在相关
的条目上。如果同时选择了多个词,那么将对这些词进行\"或\"(or)运算。
(二)叙词检索 叙词也可称为主题词,它是对自然语言进行规范化处理后的结果。每一个主题词的内涵与外延是唯一的。这样可以保证标引者和检索者在用词上的一致,提高文献的查全率和查准率。
MEDLINE数据库的叙词有主题词(Headings)和副主题词(Subheadings)两种,副主题词是对主题词概念的进一步和划分,使主题词/副主题词的组配成为一个更专指的概念,满足某一专题文献的检索。另外,每一篇文献的主题词也有主次之分,主要主题词(MJME)描述文献重点讨论的内容;次要主题词 (MIME)描述文献一般涉及的问题。叙词检索可以在两种状态下实现:
1.检索屏 Search: 提示符后
(1)用连字符\"-\"连接或结尾的检索词绝大部分作为主题词检索。
(2)用符号\"/\"连接主题词与副主题词作为叙词检索表达式,表达式为:主题词/副主题词。
(3)用字段标识符限定检索,表达式为:主题词 in MeSH。 2.叙词屏状态下
叙词屏展示的是MEDLINE数据库特有的一个主题词表(Medical Subject Headings,MeSH)。 该表由三部分组成并各有其特点。
(1)轮排索引(Permuted Index) 轮排词表索引是把词表中的主题词和款目词按单元词字顺排列所构成的字顺表。其功能在于以某个单元词为突破口,指引检索人员使用正确的主题词。在该功能下查找主题词,所输入的检索入口词可以是词的片断,一个完整的词或者一个短语。
(2)所选词注释信息(Term Information)
这部分帮助检索者理解轮排索引中所选词的意义,以及标引人员是如何使用该词的,也可指引用户去选择另一个更确切的词。在选定了确切的主题词后,系统又提供了两种检索方案供选择,一种是 Explode (扩展词)检索,另一种是Single term(单个主题词)检索。扩展检索只可用于所选词有下位词的情况,当选择了Explode 选项后,将会自动检索所选主题词和其所有下位词。单个主题词检索只会检出用所选主题词标引的文献,不会检出它的下位词。
(3)副主题词选择(Subheadings Selection)
副主题词是对主题词的进一步,用来检索更为专指的文献。 (三)字段检索
在检索屏Search:提示符后的检索词输入区内,对任何自由词可用\"in\"或\"=\"等字段限定符加上字段标识符指定在某个字段内检索。MEDLINE数据库的所有字段都可进行检索,其中性字段只有用这种方式检索才能发挥它的作用。
(四)检索结果的输出
检索结果的输出有三种方式:显示(Show),打印(Print)和套录(Download)。 (五)WinSpirs提供的其它辅助功能 1.检索史的管理 (1)检索式的再利用: (2)检索式的清除: (3)检索史的存储:
(4)检索史的调用与运行: 2.使用建议词检索
当用户不能确定用什么词检索自己的课题更好时,WinSpirs可以给出一些建议词供用户选择,这些建议词往往都是能够保证查全查准的叙词。 3.对检索结果的排序
4.使用联机帮助学习检索方法
第三节 HealthSTAR光盘检索
HealthSTAR是美国国立医学图书馆与美国医院协会(American Hospital Association)共同编辑出版的卫生管理信息书目数据库,主要涉及卫生保健服务的临床与非临床方面的文献。该库收录了1975年以来世界各种出版物中的期刊论文、专著、技术和报告、会议文摘和论文、图书章节以及报纸文章,累计文献量已达300万篇,并以每年18万篇的速度递增。文献内容主要包括卫生保健管理、卫生经济学、卫生计划和法规、卫生服务研究等多项主题。涉及的主要学科领域有:健康科学、卫生保健。数据库更新周期为月更新。
第四节 CBMDISC光盘检索
一、CBMLARS简介
CBMLARS是中国医学科学院医学信息研究所基于Windows平台开发研制的,专门用于该所研制的《中国生物医学文献光盘数据库》的信息检索软件。CBMLARS的含义是Chinese BioMedical Literature Analysis & Retrieval System,即中国生物医学文献分析与检索系统。CBMLARS的主要界面和检索功能与银盘公司的WinSpirs较为相似。
二、CBMDISC光盘数据库及其结构
该库收录了1979年以来《中文科技资料目录(医药卫生)》中收录的900多种中国期刊,以及汇编、会议论文的全部文献题录。数据库更新周期为季度更新。收录范围覆盖了生物医学的各个领域。全部题录均根据美国国立医学图书馆1997年版的《医学主题词表》(即MeSH词表)及中国中医研究院图书情报研究所新版的《中医药主题词表》进行了重新标引,并根据《中国图书资料分类法》第三版进行了分类标引。
CBMDISC的记录包括30多个字段,每个字段均为可检索数据项。
三、CBMLARS主要界面
1.数据库选择屏与版权页
CBMLARS首先出现的画面是\"数据库选择屏\",供用户选择实际检索CBMDISC的文档(回溯年限)。选择所需文档并确认后,屏幕弹出\"数据库版权页\",该页面显示CBMDISC数据库的简介以及版权信息。 2.检索屏
检索屏是CBMLARS的主要检索界面,大部分的检索途径和方式在此界面下实现。 3.索引屏
4.主题词屏
主题词屏是指导用户利用合适的主题词检索文献的辅助检索工具。 5.分类屏
分类屏是指导用户利用《中国图书资料分类法》上的分类号或分类名去检索文献的辅助检索工具。使用分类屏检索的前提是用户必须对《中国图书资料分类法》比较熟悉和了解。 6.期刊屏
期刊屏是指导用户利用期刊名称检索文献的辅助检索工具。如果用户不清楚具体刊名,期刊屏还提供通过出版单位、出版地和主题词等查找具体刊名的功能,利用查到的刊名再进行检索。
四、用CBMLARS检索CBMDISC数据库的方法与技巧
(一)CBMLARS的系统运算符 1.逻辑算符
AND 检出记录中同时含有检索词A和检索词B
OR 检出记录中含有检索词A或检索词B
AND NOT 在含检索词A的记录中,去掉含检索词B的记录 优先级运算: ( ) > AND NOT > AND > OR 2.字段限定符
in 对某一指定数据项(字段)进行检索。例: 癌症 in 刊名
= 对某一指定数据项(字段)进行精确检索。例: 刊名 = 癌症 3.通配符
? ? 替代任一半角字符或任一中文字符。例: 叶?平 叶京? 4.截词
直接键入检索词, 可自动实现截词检索。 5.范围算符
仅用于数字字段的检索,包括以下几种: = (等于) PY=1992
< (小于) PY<1984
> (大于) PY>1992 或 出版年>1992
<= (小于等于) PY<=1984 或 出版年<=1984 >= (大于等于) PY>=1992 或 出版年>=1992
- (指定范围) PY=1990-1992 或 出版年=1990-1992 6.检索式序号 #n 例:(#1 or #2)and #5 (二)检索屏状态下的检索 1.默认(缺省)字段检索
默认(缺省)字段检索表示在默认(缺省)字段内查找用户输入的检索词的过程。默认检索数据项(字段)为:中文题目、文摘、作者、主题词、特征词、关键词、期刊字段。
2.所有字段检索
所有字段检索是指输入的检索词出现在任何字段的文献皆为命中文献。 3.特定字段检索
(1)字段标识符在前,并用\"=\"连接检索词,表示精确查找,下列字段可做精确查找:AD, AU, CL, CN, CT, IP, IS, JC, MA, MH, MMH, PP, PS, TA, TI, TW, VI。例:AU = 马智超 (2)字段标识符在后,并用\"in\"连接检索词,表示对所指定字段的任意片段进行查找,此为非精确查找。所有字段均可进行非精确查找。例:马智 in AU
4.二次检索
二次检索是指在最后一个检索式检索结果的范围内进行进一步查询,进一步检索结果,提高查准率。二次检索词与上一个检索式之间的关系为\"AND\"操作。 5.检索屏状态下检索的基本规则 (1)可用单字、词或词组进行检索。
(2)检索词中如有不可检索的字符(多为特殊字符或标点)应用双引号(\" \")标识。
(3)可使用字段限定符、逻辑运算符、通配符和范围运算符进行各种组配检索。 (4)检索式序号与检索词可直接组配进行检索。 (5)使用字段英文缩写名称与中文名称效果相同。 (6)以前输入过的检索表达式可重新调用。 (三)主题词屏状态下的检索
主题词屏是利用CBMLARS联机医学主题词表进行主题词辅助检索的工具。联机医学主题词表收录了美国国立医学图书馆1997版《医学主题词表》,中国中医研究院图书情报研究所出版的《中医药学主题词表》中的所有词条。可用中文主题词或英文主题词进行查找,可选用主题词的同义词、相关词、上位词、下位词进行查找,也可浏览主题词、副主题词的注释,以及树形结构号等等。
(四)分类屏状态下的检索
分类屏是利用CBMLARS联机分类表进行分类号或分类词辅助检索的工具。联机分类表包括《中国图书资料分类法》第三版R类的内容。联机分类表可通过分类号或类名进行查找,可对指定分类号进行检索或扩展检索,也可浏览类号的概念涵义、使用范围、历史演变等内容。
(五)期刊屏状态下的检索
期刊屏是利用CBMLARS联机期刊表进行期刊名称辅助检索的工具。期刊表列出了数据库中收录期刊的名称。该表可从刊名、出版地、出版单位及主题词途径查找期刊,再用刊名进行检索。期刊表还可浏览某一期刊的详细信息。
(六)索引屏状态下的检索 索引屏是利用CBMLARS基本索引表进行自由词辅助检索的工具。索引词表包括数据库中所有可检索字段中的所有单个字和部分词组,以及主题词、汇编名称等。该表有助于用户通过浏览方式选词检索。
(七)检索结果的输出
CBMLARS检索结果的输出与WinSpirs一样,主要有显示、打印和套录。
(八)检索式的管理 1.检索式的清理; 2.检索式的保存; 3.检索式的调用。
第八章 Internet信息检索与利用
主要知识点
第一节 Internet概述
一、Internet简介
Internet的全称是Inter-network,中文译成因特网、互联网或网际网,是通过通信媒介连接的世界性计算机网络的总称。用户通过校园网、企业网(Intranet)和ISP(Internet Service
Provider)联入Internet,就可以共享巨大的信息资源和服务资源。Internet的精神是平等互联和资源共享。通过Internet检索相关数据库资源或进行网上讨论与交流已成为广大医教研人员获取生物医学信息的重要途径。
二、Internet的接入方式
(一)利用电话线和通讯软件拨号连接
(二)利用SLIP或PPP协议与一台上网主机连接 (三)网络连接
三、Internet提供的服务
1.电子邮件(E-mail) :是一种通过Internet与其它用户进行联系,方便、快捷、价廉的现代化通信手段,也是目前Internet用户使用最为频繁的服务功能。
2.文件传输(FTP):提供了任意两台计算机之间相互传输文件的功能。
3.远程登录(Telnet):用户使用远程登录命令,可以使自己的计算机暂时成为远程计算机的一个仿真终端。
4.网络新闻(USENET):即用户网络(UserNet),可使用户参与上万个几乎覆盖当今生活全部内容的新闻组交流和讨论。
5.网络检索工具:Gopher、 WAIS、Archie等。
6.万维网(WWW):是目前Internet上最方便、最受用户欢迎的信息服务类型。 7.电子公告栏(BBS):提供用户在Internet上张贴告示、通知或求助信息,并等待答复。
8.网上寻呼(ICQ):ICQ是I seek you的缩写,可帮助用户在网上寻找志同道合的朋友,并与之交谈或闲聊的工具。
9.网上聊天(IRC):IRC是Internet Relay Chat的缩写,允许许多用户轮换发言,一起聊天。
第二节 Internet的主要服务功能
一、电子邮件的使用
(一)电子邮件系统的功能
主要功能包括:邮件起草与编辑、发送邮件、收信通知、读取与检索邮件、答复与转发邮件、退信说明及邮箱管理等。
(二)电子邮件的地址
一个常见的Internet电子邮件地址的格式通常是:userid@hostname,一般由ISP(Internet Service Provider)确定;\"@\"符号读音为\"at\",表示\"在某某处\",电子邮件地址的第二段代表接收邮件的计算机即邮件服务器的域名(Domain Name)和主机名(Hostname)。在输入电子邮件地址时,注意在地址中不要输入任何空格,也不要漏掉分隔邮件地址各部分的圆点符号。
(三)电子邮件的格式
电子邮件包括邮件头(mail header)和邮件体(mail body)。邮件头主要由三部分组成:收信人电子邮件地址(To:),发信人电子邮件地址(From:)和邮件主题(Subject:)。邮件体是实际要传送的内容,即发信人输入的正文。
(四)电子邮件软件
最常用的电子邮件软件有两类,一类是在登录的主机上使用的电子邮件软件。另一类常用的电子邮件软件大多是各公司在Windows环境下开发的,使用它们有时不必登录到主机上,在用户一端就能看到自己的邮件。
(五)网上基于Web的免费E-mail服务
许多Internet服务提供商(ISP)在Internet上建立了基于WWW的免费E-mail服务器,为没有E-mail地址的Internet用户提供E-mail地址及免费的电子邮件通讯服务。
二、FTP的使用
(一)FTP的常用命令 1.FTP命令; 2.Open命令; 3.Ls或Dir命令; 4.Cd命令; 5.Get和Mget命令; 6.Put和Mput命令; 7.Ascii和Binary命令; 8.Close命令;
9.Quit和Bye命令; 10.Help命令。
(二)FTP客户软件
1.Windows 95/98的FTP客户软件
通常FTP程序在C:\\windows目录下,在MS-dos状态下,执行FTP命令即可进入FTP操作状态。具体的操作指令及方法与上节描述的FTP常用命令相同。
2.Web下的匿名FTP
由于Web上的FTP既简单又方便,因此,它是一种常用的FTP使用模式。
三、Telnet的使用
(一)Telnet概述
Telnet(远程登录)是指在网络通讯协议Telnet的支持下,用户的计算机通过Internet暂时成为远程计算机终端的过程。在HTTP(超文本传输协议)问世之前,Telnet曾经在Internet上广为应用,全世界的许多大学图书馆都通过Telnet对外提供联机检索服务,一些部门、科研机构也将他们的数据库对外开放,供用户通过Telnet查阅。目前Telnet的应用已经越来越少。
(二)Windows 95/98下的Telnet
如果用户的PC机在安装操作系统Windows 95或98时,已做好了Internet网络客户端的设置,就可以直接使用Win95或98内嵌的Telnet功能,通常Telnet程序在C:\\windows目录下,在MS-dos状态下,执行Telnet命令即可进入Telnet界面及操作状态。所有的Telnet操作均在窗口内完成。
四、WWW的使用
(一)WWW概述
WWW是World Wide Web的缩写,也被简称为W3或Web,在我国,通常翻译为全球网、万维网。它是一个把信息检索技术与超文本(Hyper Text)技术相融合而形成的环球信息系统。超文本有两个含义:其一是信息的表达形式;其二是信息间的连接方式。
(二)什么是URL
URL(Uniform Resource Locator)是指统一资源定位器,实际是一个标识文件类型及所在WWW地址的字符串。URL由三部分组成:所使用的传输协议、服务器名称、文件的全路径名。
(三)HTML简介
HTML是Hyper Text Markup Language的缩写,即代表超文本标记语言。 (四)WWW的Client/Server服务方式
所谓Client/Server是指在分布式网络环境中,进程之间\"请求\"与\"服务\"的合作关系。 (五)Web浏览器
Web浏览器(Web Browser)软件是实现WWW功能的具体体现,因此也称为Web客户软件。目前Internet上最著名、使用最为广泛的两种浏览器为Netscape公司的Communicator和Microsoft公司的Internet Explorer(简称IE)。
第三节 网上信息资源的类型与特点
一、网上生物医学信息资源的类型
(一)按内容的组织和表现形式划分
1.生物医学电子公告;
2.生物医学电子期刊杂志、电子图书、电子报纸; 3.生物医学类数据库:(1)文献库;(2)数值或事实库;(3)多媒体库; 4.电子信件,是指学者之间讨论学术问题的通信;
5.联机电子会议,是指网上召开的各种生物医学学术会议;
6.生物医学类公共软件,包括实验数据分析、统计或基因同源性比较等免费公用软件; 7.实时动态数字化视频播放,是指网上实时动态播放的各种生物医学类影视资料。 (二)按提供网络服务的方式划分
1.电子邮件资源,是指科研人员之间交流学术思想的电子信件; 2.电子论坛和网络消息组资源,包括所有与生物医学有关的讨论组; 3.文件传输(FTP)资源,包括与生物医学有关的软件或重要文档; 4.远程登录(Telnet)资源,包含许多大型文献或数值数据库; 5.Gopher资源;
6.WWW资源,WWW作为环球信息资源网,其信息资源的含量在所有网络服务方式中是最高的,涉及的内容是世界上任何一个图书馆所无法比拟的,而且信息资源的增长非常迅速。
(三)按生物医学主题(学科或疾病)划分
(四)按信息资源的来源划分
1.由个人提供的生物医学信息资源;
2.由机构或团体提供的生物医学信息资源。
二、网上生物医学信息资源的分布
Internet上的生物医学信息资源的分布极不均衡。根据一项调查统计得知,以美国为首的西方发达国家,无论是在信息资源服务器的数量上,还是在信息资源的丰富程度上都占有绝对的优势。这也反映出经济越发达的国家,其信息化程度越高,信息开放的程度也越高。再进一步对信息来源进行统计分析可知,大学和商业机构是网上生物医学信息资源的最大提供者,约占总数的70%。
三、网上生物医学信息资源的特点
1.量大分布广,离散程度高: 2.组织形式多样化: 3.更新速度快: 4.检索方式灵活:
5.规范化程度不高:
第四节 网上信息资源指南及搜索引擎
搜索引擎(Search engines)是一些在Web中主动搜索信息(搜索网页上的单词和简短的特定的描述内容)并将其自动索引的Web网站,其索引内容存储在可供检索的大型数据库中,建立索引和目录服务。
一、 一般主题指南及搜索引擎
1.Alta Vista(http://www.altavista.com); 2.Yahoo(http://www.yahoo.com); 3.InfoSeek(http://www.go.com); 4.Excite(http://www.excite.com); 5.Lycos(http://www.lycos.com); 6.Webcrawler(http://webcrawler.com); 7.Open Text(http://www.opentext.com); 8.搜狐(SOHU)( http://www.sohu.com.cn); 9.天网(WebGather)(http://e.pku.edu.cn);
10.网络指南针(http://compass.net.edu.cn:8010); 11.悠游(http://www.goyoyo.com)。
二、医学主题指南及搜索引擎
1.MedSite(http://www.medsite.com); 2.MEDguide(http://www.medguide.net); 3.HealthWeb(http://healthweb.org); 4.HealthAtoZ(http://www.healthatoz.com); 5.MedExplorer(http://www.medexplorer.com); 6.MedWeb(http://www.medweb.emory.edu); 7.Med Engine(http://www.themedengine.com/); 8.Medical Matrix(http://www.medmatrix.org)。
第五节 网络数据库检索
一、PubMed
(一)PubMed概况
PubMed是由美国国立医学图书馆附属美国生物技术信息中心(National Center for Biotechnology Information,NCBI)开发研制的Web数据库。PubMed的网址为:http://www.ncbi.nlm.nih.gov/pubmed,PubMed具有收录范围广、内容全、检索途径多、检索体系完备等特点,部分文献还可在网上直接免费获得全文。该数据库的数据来源主要包含三个方面:
1.MEDLINE;
2.PREMEDLINE:由MEDLINE的期刊出版商提供的尚未经规范处理的数据。PREMEDLINE记录都有[Medline record in process]的标记。
3.Record supplied by publisher:由出版商提供的电子文献,每条记录标有[Record as supplied by Publisher]。 PubMed的基本检索运算规则有如下两点:
1.自动转换匹配功能(Automatic Term Mapping):对于输入的检索词,PubMed将按一定的词表顺序进行对照、匹配和转换,然后进行检索。该顺序是:MeSH转换表、期刊刊名转换表、短语表、作者索引。如果在以上4个表中都找不到相匹配的词,PubMed将把短语分开,以单词为单位,分别重复以上的过程,检索时各个词之间是逻辑AND关系。如果仍找不到相匹配的词,则用单个词在所有字段查找,各个词之间也是逻辑AND关系。
2.短语检索(Phrase Searching):也可称为强迫词组检索,即如果要将短语作为一个词组进行检索,可用双引号\"\"将其引起来。
(二)PubMed检索方法与技巧
1.基本检索
在检索词输入框中可以输入任何具有实质性意义的词语,如自由词、主题词、人名等,系统将进行自动匹配检索。还可输入逻辑符号、截词符(*)等建立逻辑表达式进行检索,但逻辑符号必须大写,执行顺序为从左到右,可以用括号来改变此顺序。点击检索框旁边的'\"Go\"即可执行检索。
2.字段或条件检索
字段或条件检索以下拉式菜单的形式提供了检索字段、年龄、性别、人或动物、语种、文献类型、出版年份、入库日期以及子集数据库的限定。还可指定检索结果是否带文摘。
3.预检索及浏览索引检索 在预检索界面中可实现以下功能:(1)在显示检索结果前先显示检索结果的数量;(2)加词检索;(3)特定字段加词检索;(4)Index功能。
4.检索史的管理
检索史主要用于存储检索策略和检索结果,并可直接用已有的检索式来编制检索策略。系统规定最多可存储100条检索式。
5.主题词浏览检索
使用该项功能可选择规范化主题词、副主题词,查看词义注释、浏览树状结构表等,可执行主题词检索,因而可以提高检索效率。
6.期刊浏览检索
可以通过刊名全称、刊名缩写、ISSN号、刊名中的单个或若干个词来查找特定的期刊
以及在期刊中发表的文献。
7.检索结果的输出 (1)检索结果的显示; (2)检索结果的保存。
8.引文匹配器(Citation Matcher)
该功能是通过输入文献出处的信息来查找特定的文献或PubMed数据识别号PMID。 9.临床查询(Clinical Queries)
这是一个主要针对临床医生的检索入口,只设置了与临床疾病密切相关的4个方面:治疗、诊断、病因和预后的文献检索。用户可选择强调查全率或是查准率。
二、电子期刊全文数据库
(一)ScienceDirect OnSite《Elsevier电子期刊全文数据库》
ScienceDirect OnSite(SDOS)是荷兰Elsevier Science出版公司开发研制的,完全基于web的电子期刊全文数据库检索系统。目前,SDOS收录了1998年以来Elsevier Science出版的1277种期刊(其中生命科学600余种)的文献全文,文献原文以PDF格式存储,便于浏览和打印。累计文献量已达90余万篇,期刊册数达5万余册。该数据库涵盖了数学、物理、化学、天文学、医学、生命科学、商业及经济管理、计算机科学等众多学科。SDOS主要提供检索和浏览两种方式使用该数据库。
(二)ProQuest《保健、医学与药学电子期刊全文数据库》
ProQuest是美国Bell & Howell Information and Learning公司(原名UMI公司)编辑出版的医学电子期刊全文网络数据库。目前,ProQuest由三个子库ProQuest Health、ProQuest Medical Library、ProQuest Pharmaceutical News Index组成,收录了1986年以来全世界570种重要生物医学期刊,其中500余种是电子全文,文献原文以PDF格式或文本加图象格式存储,便于浏览和打印。其余期刊收录书目文摘信息。ProQuest提供六种检索方式:Basic Search、Guided Search、Advanced Word Search、Natural Language Search、Browse Publication和Search By Topic。
(三)CNKI《中国期刊网专题全文数据库》
CNKI是中国学术期刊电子杂志社开发研制的目前国内最大型的学术期刊全文网络数据库。该库共收录有1994年以后国内6600余种期刊的题录、摘要以及5300种期刊的全文,每日更新,积累全文文献已达500多万篇,题录1500万余条。CNKI主要提供学科浏览和检索两种方式使用数据库,其中,检索方式又分为初级检索和高级检索两种模式。
第九章 文献信息的调研
主要知识点
第一节 概述
一、文献信息调查研究的基本概念
文献信息调查研究又称文献信息分析研究(简称文献信息调研),是指对文献信息进行调查与研究。既以文献信息为对象,有目的的收集文献信息并对其内容进行识别、整理、分析、综合、选择、最后加工出新的文献信息的一种创造性劳动。
二、文献信息调查研究的特点
1.针对性
2.科学性 :(1)材料准确;(2)方法科学;(3)论点客观。 3.性
4.时间性(时效性) 5.综合性 6.预测性
三、文献信息调查研究的作用
1.提高决策和科研选题的科学化水平 2.科技项目的查新咨询工作 3.促进科学技术的交流
4.科学技术转化为生产力的桥梁 (1)为科研人员提供了充分的科技信息; (2)有利于科技成果的转让;
(3)有效的促进了科技知识的推广和应用; (4)促进了现代科学技术的深入发展。
第二节 基本方法与步骤
一、文献信息调研的基本方法与程序
(一) 文献信息调研的基本方法 1.定量研究方法
2.定性研究方法
3.定量与定性相结合的方法 (二)文献信息调研的步骤 1.选择和确定课题
2.制定文献信息调研计划 (1)课题调研的目的 (2)调研大纲
(3)组织分工
(4)制定调研时间与实施步骤 (5)调研成果的表述形式
3.文献信息的收集和调研
4.文献信息的整理、鉴别和评价 5.文献信息的分析 6.撰写调研报告
二、文献信息的收集与整理
(一)文献信息的收集 1.针对性 2.系统性 3.积累性 4.计划性
5.预见性
(二)文献信息的整理
1.文献信息的阅读理解 一般采用浏览、泛读和精读三种方法。
2.文献信息的选择甄别 标准是文献信息的可靠性、新颖性与可用性。
3.文献信息的摘录 简要记录文献的有关内容项目,便于揭示和查找原文。著录的内容可以根据文献参考价值的大小,分别可作卡片、全文复制和抄录、使用管理软件及整序。
三、文献信息的分析方法
1.因果分析法 是指具有相互依赖,相互联系的关系中最严格的一种关系,因果关系必须同时满足以下条件:
(1)作为\"因\"的一方与作为\"果\"的一方之间存在着必然的联系。 (2)因与果在时间上是先后相继的,原因在先,结果在后。
(3)因与果之间存在着固定的定量关系,一般可用准确的数量关系或数学模型来表达。 2.类比分析法 是根据两个和/或两类事物之间在部分属性上的相似来推测它们在其它属性上也可能相似的一种思维方法和推理形式,借以获得对新事物的理解和认识。 3.Meta分析法 是一种结合文献计量学方法综合分析已有的研究成果(如有关某一药物的疗效、某种病因的研究等),或设计新的研究课题方案的一种文献分析方法。
4.特尔斐法(Delphi) 是按一定程序向有关领域的专家进行调查。通过专家判断和定性、定量的综合分析,经几次反复,最后得出预测结果。
5.文献计量学方法 文献计量学(bibliometrics)是以文献为主要研究对象,采用数学、统计学方法,对文献进行定量分析的一门交叉学科。
6.引文分析法 是根据文献间存在的相互引证关系和特点,运用统计学及数学、逻辑思维方法等,对文献的引用和被引用现象进行分析,用来评价期刊和论文的质量、科研机构或著者的学术水平及预测某学科的发展趋势的一种定量学的方法。
引文分析法的作用:
(1)通过引文分析来确定核心期刊;
(2)分析科学文献的著者群及其形成规模、分布以及随时间的变迁状况; (3)预测科学发展的热点及其科研发展结构等。
第三节 文献信息分析成果的表达
一、文摘 1.文摘的概念 文摘(abstracts)是以提供文献内容梗概为目的,不加评论和补充解释、简明、确切地记述文献重要内容的短文。
2.文摘的功能 主要功能是它的报道功能。文摘忠实地、准确地报道了原始文献中的信息。
3.文摘的类型 按报道信息量的不同,可分为:
(1)报道性文摘;
(2)指示性文摘 是以\"表示著作类型、包括的主要主题以及处理问题方法的文摘\"; (3)选择性文摘 是介于报道性文摘和指示性文摘之间的一种文摘,兼具报道性文摘与指示性文摘的特点;
(4)结构式文摘 是作者本人对科研论文的内容所做的摘要。
4.文摘的编写格式
(1)研究目的:是指原文所要解决的问题、研究的范围及写作的目的。
(2)研究方法:是指原文所介绍的处理因素、试验对象及观察指标。文摘要尽可能的将原文所介绍的研究方法、原理、试验或实验用材料及条件等叙述出来。
(3)研究结果:是指试验或实验结果及理论成果。
(4)研究结论:是指文献作者对整个课题研究过程所做的全面和周密的分析后所得的结论。
5.文摘的编写步骤
(1)通读原文:在通读的过程中,初步了解文献的主题内容,判断中心题材的现实意义,所含信息的新颖性、可靠性和实用性,并以此作为判定应否为该文作文摘及作何种形式的文摘。
(2)精读原文:在精读的过程中深入了解原文的主要内容,将有用的知识分解为若干个要素,分清主次。
(3)分析提炼:对原文中的重要信息要素加以提炼,并对其重要性和可用性做标记。将它们写成语言简单明了的句子,把具有实质性内容的句子按其语义的大小依次排列。
(4)反复审核校对:写成的文摘初稿要对其内容进行反复仔细复核和文字的推敲后方可定稿。
二、综述
1.综述的概念 是\"就某一问题或某些问题,从一定时期内相当大量的专门选定的原始文献中摘取情报,利用这些情报对问题进行综合性叙述,这样写成的经过综合加工的文章叫综述。
综述有三个特征:
(1)以多种文献情报源为素材或原料;
(2)它要论及的问题多寡与大小是随意的; (3)采用的方法主要是分析与综合。
2.综述的主要作用
(1)是原始论文的压缩。 (2)是培养科研人员情报意识,锻炼科研思维方法的重要手段。 (3)是为科研立项和成果鉴定答辩做准备。 3.综述的类型及写作方法
(1)动态性综述:指一个专题按年代叙述学科本身发展历史的各阶段,内容安排上按时间顺序,由远到近的综合分析,反映研究工作的进展。这种描述不同历史阶段的成就,学科阶段发展要准确,每一阶段要有代表性文献。
(2)成就性综述:指专门介绍某一项目的新成就、新技术、新进展,不需要考虑历史现状和时间顺序。
(3)简述性综述:对没有成定论的文献进行综述。按内容特点进行分析,不考虑时间顺序。也可对某一个问题、某一疾病文献报道的现象和事实作一综合性叙述。
(4)争鸣性综述:对同一问题从不同的角度进行阐述,系统地总结集中学术观点,由作
者加以分析、分类、归纳、整理,按不同的观点材料分别叙述,对原文事实观点,要求严格,不用或少用作者的概括性分析。
4.综述的写作格式 一般包括题目、作者和作者单位、摘要、前言(序言)、主体部分、总结、参考文献。
三、学术论文
1.学术论文的概念 某一学术课题在实验性、理论性或观测性上具有新的科学研究成果或创新见解和知识的科学记录;或是某种已知原理应用于实际中取得新进展的科学总结,用以提供学术会议上宣读、交流或讨论;或在学术刊物上发表;或作其他用途的书面文件。
2.学术论文的类型 按论文的功用一般可分为科研论文和学位论文。 3.学术论文的特点 科学性、创新性、实用性、文学性。 4.学术论文的写作过程
(1)选择研究课题 (2)文献信息检索和分析 (3)确定课题的研究目标
(4)拟定方案 (5)分析论证
5.学术论文的格式 一般由标题、著者及著者单位、摘要、关键词、绪论、资料与方法、结果、讨论、结论、参考文献和致谢项目组成。
谢志耘:现在开始发布重点学习内容。
第一章 概论 重点学习内容
第一节:信息、知识和情报的概念(定义);三者之间的相互关系。
第二节:文献的定义和属性;科技文献的类型(重点是根据加工层次划分的二次文献和三次文献);核心期刊(Core Journals)的概念;科技文献的特点。 第三节:文献检索的概念;文献检索的原理;检索语言的概念和作用;主题语言的类型与差别;检索工具、查全率和查准率的概念(注意:查全率和查准率之间的关系);检索工具的基本类型及一般结构;文献检索的基本方法和途径(3种方法5种途径);文献检索的基本步骤(共5步)。
第二章 国内文献检索刊物 重点学习内容
第一节:国内医学文献检索刊物的类型(题录式和文摘式)和特点。
第二节:《中文科技资料目录》医药卫生分册的结构编排特点、它的分类和主题途径的检索方法。
第三节:《中国医学文摘》的结构编排、它的分类,主题和作者途径的检索方法。
第三章 国外文献检索刊物 重点学习内容
第一节: 国际四大检索刊物;生命科学四大文献检索刊物; 第二节:IM的创刊年、编辑出版单位;IM主题索引的编排规则;《医学主题词表》(Medical Subject Headings,MeSH)(主题词变更表、MeSH字顺表、树状结构表、副主题词表);MeSH字顺表的参照系统;IM主题途径和著者途径的检索方法;
第四章 特种文献检索 重点学习内容
第一节:专利的概念;中国专利的类型(发明专利、实用新型专利、外观设计专利);授予专利权的条件(新颖性、创造性和实用性);专利的审批制度;专利法的概念及特征;知识产权的概念及特点;同族专利的概念;国际专利分类法;
第二节:标准文献的概念、类型及特点; 第三节:科技报告的概念及特点;美国四大科技报告(PB报告、AD报告、NASA报告、DE报告);
第四节:学位论文的概念及特点;
第五节:会议文献的概念;
第五章 美国《科学引文索引》 重点学习内容 第一节:引文和来源著者的概念;SCI的作用; 第二节:SCI的结构编排;
第三节:SCI各种检索途径的用途和使用方法。
第六章 计算机检索概论 重点学习内容
第一节:计算机信息检索的发展阶段;机械检索的形式。
第二节:计算机信息检索的基本原理;顺排文档和倒排文档的概念。
第三节:计算机信息检索系统的构成;数据库的定义;数据库的类型(参考数据库、源数据库);数据库的结构(文档、记录和字段)。
第四节:计算机检索方式(脱机检索、联机检索、光盘检索、网络检索);联机检索的概念。
第五节:计算机信息检索的基本步骤;计算机检索系统中常用的运算符(布尔逻辑运算符、位置算符、字段限定符和截词算符);检索策略的反馈调整。
第七章 光盘数据库检索 重点学习内容
第一节:光盘的概念和类型;光盘的特点。
第二节:自由词检索;叙词检索;字段检索。 第三节:(无重点) 第四节:字段限定符(in和=)在MEDLINE和CBMDISC数据库中的差别;二次检索。
第八章 Internet信息检索与利用 重点学习内容
第一节:Internet的概念;Internet的接入方式;Internet提供的服务。 第二节:电子邮件地址的组成;FTP的常用命令;URL的概念。 第三节:网上生物医学信息资源的类型和特点。 第四节:因特网搜索引擎的概念、类型及意义。 第五节:自动转换匹配功能;短语检索;
第九章 文献信息的调研 重点学习内容
第一节:文献信息调查研究的基本概念。
第二节:文献信息调研的基本步骤;文献计量学的概念。
第三节:文摘的概念;文摘的类型(比较报道性文摘与指示性文摘的区别);综述的概念;学术论文的概念、类型和特点。
谢志耘:现在开始发布考试大纲。
广播电视大学《文献检索》考试大纲
考试总要求
考生应掌握手工和计算机文献信息检索工具的使用方法,理解文献信息及文献检索的基本概念和原理,能够运用文献信息检索技术、检索方法和技巧全面快速地查找与自己专业相关的文献信息,并运用于自己的医疗和科研活动中,并具有初步的信息分析利用能力,具备一定的信息素质。
第一章 概论 考试范围
一、描述信息、知识和情报的基本概念
信息是无形的,它是客观事物的运动状态和特征的反映,是人们认识事物发展的基础。知识是人类对自然界、人类社会中各种现象、规律的信息反映进行思维分析,加工提炼,经过系统化、理论化的过程。系统化、理论化的信息就称为知识。情报是人们在一定的时间内为一定的目的而传递有使用价值的知识或信息。情报具有保密性、时效性、传递性的特点。
三者的关系是:信息是知识的源泉;知识是系统化、理论化的信息;情报是活化的知识和信息,能为人们所利用,其涵义关系是信息>知识>情报。
二、简述文献的定义和属性
凡属于人类的知识,用文字、图形、符号、声频、视频等手段记录保存下来,并用以交流传播的一切物质形态的载体,都统称为文献。知识是文献的实质内容,载体是文献的外在形式,而记录是联系知识与载体的手段。
三、陈述科技文献的类型
1.按加工层次划分:一次文献(期刊论文、研究报告、会议录、专利说明书、学位论文等)、二次文献(目录、索引、文摘等)、三次文献(评论、述评、进展、动态、年鉴、专著、指南等)、零次文献(书信、手稿、笔记、记录等)。 2.按载体形式划分:印刷型、缩微型、视听型、电子型。
3.按文献出版类型划分:科技图书、科技期刊、资料(专利文献、会议文献、科技报告、出版物、学位论文、标准文献、产品资料、技术档案)
四、阐述科技文献的特点 1.数量多、增长快
2.内容交叉渗透、分散重复 3.语种不断增加
4.失效快、寿命短
5.文献发表的时间滞后严重 6.交流传播速度加快 7.日益向多元化发展
五、解释文献检索的概念
文献检索是将文献按照一定方式集中组织和存储起来,并按照文献用户需求查找出有关文献或文献中包含的信息内容的过程。所以广义上的文献检索实质上是包括文献的存储和文献的检索两个过程。
六、知道文献检索的目的和意义
1.继承和借鉴前人成果,避免重复研究
2.节省科研工作时间,提高科研效率 3.协助决策者做出正确决策
4.终身学习、知识更新的必备工具 5.开发情报信息资源,提高经济效益 七、描述文献检索原理
文献检索的基本原理就是检索者将主题检索概念与存储在检索工具(或系统)中的检索特征标识进行比较,最后达到一致,以此来有效地查得并获取文献。
八、解释检索语言的概念和作用 1.检索语言的概念:检索语言是用于描述检索系统中文献的内容特征及外表特征和表达用户检索提问的一种专门语言。
2.检索语言的作用:使文献的存储与检索两过程所采用的特征标识达到一致的中间纽带,是检索者与检索工具之间进行交流的标准,也是情报存储人员与检索工具之间进行交流的标准。检索者、情报存储人员、检索工具三者通过检索语言来互相沟通。 九、比较不同类型的检索语言
1.按照检索语言中所使用语词的受控情况分为:规范语言(如单元词语言、标题词语言、叙词语言)和非规范语言(关键词语言)
2.按照检索语言所描述的文献内容特征分为:分类语言、代码语言、主题语言。其中主题语言又分为关键词语言(后组式语言)、单元词语言(后组式语言)、标题词语言(先组式语言)、叙词语言(后组式语言)等。
十、解释检索工具、查全率和查准率的概念
1.检索工具是指用以存储、报道和检索文献的工具,它具有存储、报道和检索三个职能。 2.查全率是检出的相关文献量占检索系统中相关文献总量的百分数,查准率是检出的相关文献量占检出文献总量的百分数。查全率和查准率之间存在互逆关系,如果某检索工具的查全率较高,则其查准率将相对下降;反之,查准率高,则查全率低。查全率和查准率只能相对提高,二者永远不可能同时达到100%。查全率和查准率是反映检索工具质量的两个最主要也是最常用的指标,它们也是评价检索效果高低的两大因素。
十一、列举检索工具的基本类型及一般结构
1. 检索工具的基本类型:目录、题录、文摘、全文。
2. 检索工具的结构:检索工具一般由编辑使用说明、目次表、正文、索引和附表等五个部分组成。
十二、熟悉文献检索的基本方法和途径
1. 文献检索的基本方法:追溯法、常用法、综合法。
2. 文献检索的基本途径:分类途径、主题途径、著者途径、号码途径、其它途径。 十三、熟悉文献检索的基本步骤 1.分析课题
2.选择检索工具和方法 3.选择检索途径和检索标识 4.查找文献
5.获取原始文献
第二章 国内文献检索刊物 考试范围
一、了解国内检索刊物的历史及现状
1934年开始有文摘性检索刊物;1956年开始出版医学索引刊物;1978年后形成一定的规模;目前检索刊200多种,其中医学10多种。
国内检索刊物的特点:规范化根据《汉语主题词表》、《医学主题词表》和《中国中医药学主题词表》进行标引;正文部分一般依据《中国图书馆分类法》编排;检索途径以主题途径和分类途径为主。
常用国内医学文献检索刊物:分为题录式和文摘式两种。题录式包括:《中文科技资料目录》(医药卫生)、《国外科技资料目录》(医药卫生)、《中文科技资料目录》(中草药)、《1949-1979 医学论文累积索引》、《全国报刊索引》(科技版)等。文摘式包括:《中国医学文摘》、《中国药学文摘》、《中国生物学文摘》、《国外医学》等。
二、知道《中文科技资料目录》(医药卫生)的历史及现状
1963.4创刊,中国医学科学院医学信息研究所编,月刊,题录型。 三、陈述《中文科技资料目录》(医药卫生)的编排结构与特点
以学科分类为主,主题索引为辅;主要包括:分类目次、正文部分、学科分类类名索引、主题索引首字字顺表、主题索引(由主题词、副主题词和题录顺序号组成)。
四、熟悉《中文科技资料目录》(医药卫生)分类途径和主题途径的检索方法
1.分类途径:是从学科分类入手,以分类号、类目名为检索标识检索文献的途径。其检索步骤为:(1)分析课题,了解相关课题所属的学科范畴,在“本期学科分类类名索引”中按汉语拼音顺序查出分类号、类目名;(2)确定课题的类目号、类目名,之后再根据课题的学科范畴,在分类目次中查出类目的页码;(3)根据分类目次所指示的页码,到本期正文中查阅文献题录;(4)找到所需要的文献题录后,根据其所提供的文献来源(出处)中所提供的期刊或资料查找全文。
2.主题途径:是指以经过规范化的主题词为检索标识,利用主题索引检索文献的途径。 3.如何利用分类途径与主题途径:利用分类途径与主题途径的特点根据课题需要做出检索选择。
五、知道《中国医学文摘》的历史及现状
1982年创刊,按18个分册出版,出版周期各异,文摘型。 六、陈述《中国医学文摘》的编排结构与特点
按学科分册编排,每期以学科分类为主,主题索引为辅;主要包括:目次、正文部分、主题索引(主题词、副主题词和文摘号组成)和著者索引。
七、熟悉《中国医学文摘》分类途径、主题途径及著者途径的检索方法
1.分类途径:分类目次或目录,类目名称->英文类目名称->文摘号->页码。 2.主题途径 3.著者途径
第三章 国外文献检索刊物 考试范围 一、了解国外检索刊物的历史及现状
起步较早,7-8世纪创立索引,17世纪出版文摘刊物。目前,数量保持2500种左右。四大检索刊物:美国《工程索引》、英国《科学文摘》、前苏联《文摘杂志》和日本《科学技术文献速报》。
国外检索刊物的特点:历史悠久、发展快速;规范程度高和实用性强;规模大、质量高;索引体系完备。
二、知道美国《医学索引》的历史、现状及特点
Index Medicus,简称IM, 1879年创刊,当今世界上最常用的生物医学文献题录型检索刊。1942年后由NLM编辑出版,1950年由周刊改为月刊,1960年恢复创刊之初刊名。特点:收录范围广;编辑力量强、标引质量高;时差短;编制简单、查找方便。
三、阐述美国《医学索引》的编排结构及其特点
1.期索引:主题索引部分(将IM收录的全部文献题录按主题词和副主题词作为索引标目,形成主题检索的标目系统)、著者索引部分(以著者(包括合著者)的姓名为标目,按其字顺排列而成的索引)、医学综述题录(将主题索引部分或著者索引部分中出现的所有综述性文献单独抽出、集中编排而成的索引。
2.卷索引
四、识别主题、综述及著者部分的著录格式
Providing palliative care for Aboriginal patients. Fried O. Aust Fam Physician 2000 Nov;29(11):1035-8 (17 ref.)
五、解释医学主题词表(Medical Subject Headings,MeSH)的结构编排特点
1.主题词变更表:当年主题词的增删更改情况
2.MeSH字顺表:全部主题词(包括少量款目词、类目词)按英文字母顺序排列而成。内嵌参照系统(用代参照、属分参照和相关参照)描述词间关系。
3.树状结构表:将主题词按学科分类集中,反映主题词之间概念上的逻辑隶属关系。 4.副主题词表:对主题词的进一步,使主题词的专指性更强。共有82个。 六、熟悉美国《医学索引》主题途径及著者途径的检索方法 (一)主题途径
1.主题词选择原则:(1)首选专指词,注意倒置主题词;(2)次选主副组配词;(3)再选上位词;(4)靠词检索
2.副主题词选择:(1)隐含的副主题词;(2)副主题词组配范围的限定;(3)副主题词定义的
3.注意配对选词
4.注意配合使用树状结构表来选词 (二)著者途径
第四章 特种文献检索 考试范围
一、解释专利的概念
专利是指国家以法律形式授予发明人或其权利继受人在法定期限内对其发明创造享有的专有权。
中国专利的类型:发明专利、实用新型专利、外观设计专利。 授予专利权的条件:新颖性、创造性和实用性。
专利的审批制度:形式审查制;实质审查制;延迟审查制。 二、描述专利法及知识产权的概念
专利法是国家制定的,用以调整因确认发明创造的所有权和因发明创造的利用而产生的各种社会关系的法律规范。专利法的特征:国内法;特别法;实体法,也是程序法。 知识产权即\"智力成果权\",是指科学、技术、文化艺术等领域从事智力活动而创造的精神财富所享有的权利。知识产权的特点:1.独占性;2.地域性;3.时间性。
三、陈述专利文献的概念、类型、特点及作用
1.专利文献的概念:是实行专利制度的国家、地区及国际性专利组织在审批专利过程中产生的官方文件及其出版物的总称。
2.专利文献的类型:(1)按法律性质分为申请说明书和专利说明书两种。(2)按技术内容分为发明专利说明书、实用新型专利说明书和外观设计文件。(3)按加工层次分为专利说明书;专利文摘、索引、题录、公报等;专利分类表、分类表索引等。
3.专利文献的特点:(1)提供经济、技术和法律信息;(2)内容新颖、范围广泛;(3)内容详尽、可操作性强;(4)出版迅速,重复量大;(5)分类和检索方法特殊。
4.专利文献的作用:(1)法律作用;(2)技术指导作用;(3)经济作用。
四、熟悉国际专利分类法
IPC表采用等级形式,将技术内容按部(Section)、分部(Subsection)、大类(Class)、小类(Subclass)、主组(Group)、分组(Subgroup)逐级分类,形成完整的分类体系。一个完整国际专利分类号由部、大类、小类、主组或分组的类号组成。
五、熟悉中国专利文献检索工具及其使用方法 1.中国专利文献检索工具:
① 公报类:《发明专利公报》、《实用新型专利公报》、《外观设计专利公报》三种; ② 索引类:《中国专利索引》,又包括《分类年度索引》和《申请人、专利人年度索引》;
③ 通报类:《中国专利文献通报》;
④ 其它类:《中国专利分类文摘》、《中国专利报》等。
2.中国专利文献的检索方法:主要可以从国际专利分类号、专利号、专利权人等几个途径去查找。
六、熟悉德温特专利文献检索工具及其使用方法
1.德温特专利:英国德温特公司出版物,包括分国专利文摘系统和世界专利索引。《世界专利索引》又分《世界专利索引题录周报》和《世界专利文摘周报》两种。 2.《世界专利索引题录周报》:题录形式报道专利文献。含四个分册,检索途径有专利权人途径、国际专利分类途径、登记号途径、专利号途径。
3.《世界专利文摘周报》:检索途径有分类途径、专利权人途径、登记号途径。 七、解释标准文献的概念、类型及特点
1. 标准文献的概念:一般是指由技术标准、管理标准及其它具有标准性质的类似文件所组成的一种特定形式的科技文献体系,包括标准、规范、规程、标准草案和技术要求。
2. 标准文献的类型:
(1)按照其在国民经济中的作用和性质分为:技术标准和管理标准; (2)按照标准化对象的特征可以分为四大类:基础标准、产品标准和技术条件、方法标准、安全与环保标准;
(3)按照使用范围可以分为四大类:国际标准、区域标准、国家标准、行业标准; (4)按照内容可分为:基础标准、产品标准、方法标准、安全与环境标准、经济管理标准、行政管理标准等;
(5)按照成熟程度可分为:法定标准、推荐标准、试行标准、标准草案。
3. 标准文献的特点:1.权威性;2.规范性;3.法律性;4.协调性;5.时效性;6.标准文献之间是相互引用或交叉重复。
八、解释科技报告的概念及特点
1. 科技报告的概念:科学研究的正式成果报告,或是某项课题研究过程某一阶段进展情况的实际记录。
2. 科技报告的特点:1.无固定出版周期;2.出版发行不规则;3.不公开发行;4.科技信息含量大。
3. 美国四大科技报告:PB报告、AD报告、NASA报告、DE报告
九、知道学位论文的概念
是指高等学校或科研单位的毕业生为取得学位资格而撰写的学术性研究论文。学位论文的特点是专业性、知识性、独创性。 十、知道会议文献的概念
是指各学术研究机构的科技人员在各专业会议上宣读的论文和报告。
第五章 美国《科学引文索引》 考试范围 一、知道《科学引文索引》的历史、现状 《科学引文索引》(Science Citation Index,简称SCI);美国Institute for Scientific Information(ISI)编辑出版;1961年开始编制,1963年编成出版,双月刊。收录著者的论文及其被引用情况。
二、阐述《科学引文索引》的特点及作用
1.对引文及引文作者的评价作用。
2.对期刊学术水平和影响力的评价,为选择和确定核心期刊提供依据。 3.在相近课题同行之间的桥梁作用。 4.对科研动态的分析作用。
三、阐述《科学引文索引》的结构编排及其特点
1.引文索引(Citation Index):著者引文索引、团体著者引文索引、匿名引文索引、专利引文索引。
2.来源索引(Source Index):团体索引(地理部分和机构部分)、来源著者索引。 3.轮排主题索引(Permuterm Subject Index)
4.来源出版物一览表(Lists of Source Publications)
四、熟悉《科学引文索引》引文途径、来源途径及主题途径的检索方法 1、引文途径:(1)著者引文途径:欲了解或评价某位学者的学术水平、科研成果、在某学科上所作的贡献及在国际上的知名度等,可通过引文索引查找该专家的姓名及其论文被人引用的情况。(2)专利引文途径:若查找某一专利的引用情况,可以利用专利引文索引途径。
2、来源著者途径:在来源著者索引中,利用姓名查找著者文献。
3、团体索引途径:了解某科研机构科研人员发表的论文被SCI收录情况。
4、主题途径:查找某一研究课题的文献,可利用关键词从轮排主题索引进行查找。
5、综合途径:将上述几种途径结合起来,配合使用。
第六章 计算机检索概论 考试范围
一、了解计算机文献检索的起源、发展 计算机信息检索始于20世纪50年代初,19年诞生了世界上第一个计算机检索系统。60年代中期提供脱机检索服务。70年代初,计算机检索进入联机检索阶段。进入80年代以后,国际联机信息检索阶段。到了80年代末、90年代初,发展成计算机网络检索阶段,同一时期出现光盘检索。
二、阐述计算机信息检索的基本原理及顺排文档和倒排文档的概念
(一)基本原理
计算机信息检索是利用计算机对信息进行存储与检索的过程,信息存储和信息检索具体来讲也就是数据库的建立与利用两个方面。
计算机检索的基本原理,就是通过一定的方法和手段,使计算机信息存储与信息检索两个过程所采用的特征标识达到高度一致,以便有效地获得和利用原始文献。这两个过程是相辅相成的。
(二)顺排文档和倒排文档的概念
将数据库中全部记录按一定顺序排列而成的文献记录集合就构成数据库的顺排文档;而将这些记录的全部文献特征标识按一定顺序排列而成的集合就构成数据库的倒排文档。顺排文档存入了数据库的全部记录;倒排文档则存入了数据库全部记录的文献特征标识(即索引
单元)。
三、熟悉数据库的定义、类型及结构
1.数据库的定义:是在计算机存储设备上按一定方式存储的相互关联的数据集合。 2.数据库的类型:①参考数据库:是指引用户到另一信息源以获得原文或其它细节的一类数据库,包括书目数据库和指南数据库两种。②源数据库:是能直接提供原始资料或具体数据的数据库,用户不必再查阅其它信息源,包括数值数据库、事实数据库、全文数据库、术语数据库、图像数据库等。
3.数据库的结构:(1)文档:若干个逻辑记录构成的信息集合称为文档。(2)记录:是由若干字段组成的文献单元。(3)字段:是构成记录的基本单元,是对实体的具体属性进行描述的结果。
四、列举计算机检索系统的构成和计算机检索的方式
1.计算机检索系统的构成:通常由计算机硬件、检索软件、数据库、检索终端及通讯线路组成。其中数据库是计算机信息检索系统的最重要组成部分,是信息资源的集散地,是被检索的对象。
2.计算机检索方式:脱机检索、联机检索、光盘检索和网络信息检索 五、比较联机检索与光盘检索的优缺点
联机检索的优点:1.克服了地理上的障碍,极大地提高了信息的可获性;2.消除了时间上的延迟现象,可以马上得到检索结果;3.保证检索者获得最新、最及时的文献信息;4.\"人机对话\"方式可使检索者随意修改检索策略,从而达到很高的查全率和查准率。 联机检索的缺点:1.检索费用较高;2.受地区通讯线路质量的影响较大;3.检索技术较为复杂,难以成为普及型的检索手段。
光盘检索的优点是:①使用方便、简单,易于操作;②不受机时的,可反复修改检索策略,达到很高的检全率与检准率;③检索费用低廉,没有通讯费用,一次订购,反复使用。
光盘检索的缺点是:①数据更新周期较慢,时差长,文献的新颖性不够;②同一时间只能一人使用,资源浪费较大。
六、熟悉计算机文献检索的基本步骤
1.分析课题确定主题概念 2.选择检索方式和数据库 3.确定检索途径
4.编制检索策略(检索式) 5.检索策略的反馈调整
6.检索结果的输出
七、熟悉计算机检索策略的编制与调整
(一)检索系统中常用的运算符或检索规则:(1)布尔逻辑运算符:and、or和not;(2)位置算符:with、near、pre3等;(3)字段限定符:in、=;(4)截词算符:*、?等。
(二)检索策略的反馈调整:
检索结果太多,且查准率较低时:1.减少同义词或同类相关词;2.提高检索词的专指度,尽量采用专指性强的主题词或自由词;3.增加概念,用逻辑\"与\"(and)将它们连接起来;4.使用限定字段检索,把检索词限定在题目、主题词等主要字段;5.使用适当的位置算符,排除误检,提高查准率;6.减少检索年限,检索结果的文献类型(如综述)、语种及出版国,或限定在核心期刊检索。
检索结果太少,查全率较低时:1.增加同义词或同类相关词,并用逻辑\"或\"连接这些词;2.降低检索词的专指度,可从词表或检出文献中选择上位词或泛指词补充到检索式中;
3.减少概念,少用and运算符,删除一些非关键的检索词;4.进行扩展检索(族性检索),根据词表的分类结构体系扩展关键的检索词;5.取消某些过严的字段、位置算符(或者改用程度较小的位置算符);6.增加回溯检索年限。
第七章 光盘数据库检索 考试范围
一、解释光盘的概念及特点
光盘是一种用激光技术在特制的圆盘上记录和再生信息的介质,是一种不同于磁性载体的光学存储器。三种类型:只读光盘、写读光盘、可擦写光盘。
光盘的特点:存储容量大;读取速度快;稳定性好,坚固耐用;使用寿命长;使用方便。
二、描述光盘数据库及光盘检索系统
光盘数据库是指利用光盘为载体实现的数据库。常用生命科学光盘:MEDLINE、EMBASE、BA、CA、IPA、SCI、JCR、CBMdisc、CMCC、CPA。
利用光盘数据库作为信息源建立起来的计算机信息检索系统称为光盘检索系统。光盘检索系统根据建立的方式不同可分为:单机光盘检索系统和光盘网络信息检索系统。
三、陈述MEDLINE光盘数据库的特点及结构
MEDLINE:美国国立医学图书馆(NLM)编辑出版;最权威的医学数据库;涵盖Index Medicus、Index to dental Literature、International Nursing Index的内容;收录1965年以来世界70多个国家地区的3900余种医学核心期刊的文献;涉及学科:基础医学、临床医学、护理学、口腔医学等。MEDLINE数据库每篇文献由题目、作者、作者地址、文摘和来源等26个字段组成。
四、熟悉MEDLINE光盘的检索方法与技巧
1.自由词检索:布尔逻辑检索、截词检索、位置检索(with、near、near#等位置运算符的运用)。
2.叙词检索:区分主题词和副主题词及其组配使用。
3.字段检索:运用in或=进行检索。性字段和默认字段的涵义。
4.检索结果的输出:显示(Show),打印(Print)和套录(Download)。
5.WinSpirs提供的其它辅助功能:检索史的管理、使用建议词检索、检索结果排序、联机帮助学习检索方法。
五、陈述中国生物医学文献光盘数据库的特点及结构
CBMDisc:中国医学科学院医学信息研究所编辑出版;收录1978年以来《中文科技资料目录(医药卫生)》中收录的900多种中国期刊,以及汇编、会议论文的全部文献题录。数据库更新周期为季度更新。收录范围覆盖了生物医学的各个领域。CBMDISC的记录包括30多个字段,每个字段均为可检索数据项。
六、熟悉中国生物医学文献光盘的检索方法与技巧
(一)CBMLARS的系统运算符:逻辑算符(AND、OR、AND NOT);字段限定符(in、=);通配符(?);截词;范围算符;检索式序号。
(二)检索屏状态下的检索
1.默认(缺省)字段检索:直接输入检索词或检索式。
2.所有字段检索:检索词 in all
3.特定字段检索:“字段标识符=检索词”(精确查找);“检索词 in 字段标识符”(非精确查找或模糊查找)。 4.二次检索:是指在最后一个检索式检索结果的范围内进行进一步查询,进一步检索结果,提高查准率。二次检索词与上一个检索式之间的关系为\"AND\"操作。
(三)主题词屏状态下的检索:利用CBMLARS联机医学主题词表进行主题词辅助检
索的工具。
(四)分类屏状态下的检索:利用CBMLARS联机分类表进行分类号或分类词辅助检索的工具。
(五)期刊屏状态下的检索:利用CBMLARS联机期刊表进行期刊名称辅助检索的工具。
(六)索引屏状态下的检索:利用CBMLARS基本索引表进行自由词辅助检索的工具。 (七)检索结果的输出:显示、打印和套录。 (八)检索式的管理:检索式的清理、保存、调用。
第八章 Internet信息检索与利用 考试范围 一、解释Internet的概念
Internet的全称是Inter-network,中文译成因特网、互联网或网际网,是通过通信媒介连接的世界性计算机网络的总称。
二、陈述接入Internet的基本方式
1.利用电话线和通讯软件拨号连接;2.利用SLIP或PPP协议与一台上网主机连接;3.网络连接
三、熟悉Internet提供的服务 1.电子邮件(E-mail) ;2.文件传输(FTP);3.远程登录(Telnet);4.网络新闻(USENET);5.网络检索工具Gopher、 WAIS、Archie等;6.万维网(WWW);7.电子公告栏(BBS);8.网上寻呼(ICQ);9.网上聊天(IRC)。
四、熟悉E-mail、FTP、Telnet、WWW的基本概念及使用
(一)电子邮件
1.概念:一种通过Internet与其它用户进行联系,方便、快捷、价廉的现代化通信手段。 2.电子邮件系统的功能:邮件起草与编辑、发送邮件、收信通知、读取与检索邮件、答复与转发邮件、退信说明及邮箱管理等。
3.电子邮件的地址:userid@hostname,地址中不能有空格。 4.电子邮件的格式:邮件头(mail header)和邮件体(mail body)。 (二)FTP
1.概念:提供了任意两台计算机之间相互传输文件的功能。 2.常用命令:put和Mput命令;Ascii和Binary命令;
(三)Telnet
是指在网络通讯协议Telnet的支持下,用户的计算机通过Internet暂时成为远程计算机终端的过程。
(四)WWW
1.概念:WWW是World Wide Web的缩写,也被简称为3W或Web,通常译为全球网、万维网。它是一个把信息检索技术与超文本(Hyper Text)技术相融合而形成的环球信息系统。超文本有两个含义:其一是信息的表达形式;其二是信息间的连接方式。
2:URL:URL(Uniform Resource Locator)是指统一资源定位器,实际是一个标识文件类型及所在WWW地址的字符串。URL由三部分组成:所使用的传输协议、服务器名称、文件的全路径名。
3.HTML:Hyper Text Markup Language的缩写,即代表超文本标记语言。
4.WWW的Client/Server(客户/服务器)服务方式:
5.Web浏览器:Web客户软件,如Netscape的Communicator和Microsoft的IE。 五、列举网上医学信息资源的类型及特点
(一)网上医学信息资源的类型
1.按内容的组织和表现形式划分:生物医学电子公告;生物医学电子期刊杂志、电子图书、电子报纸;生物医学类数据库;电子信件;联机电子会议;生物医学类公共软件;实时动态数字化视频播放。
2.按提供网络服务的方式划分:电子邮件资源;电子论坛和网络消息组资源;文件传输(FTP)资源;远程登录(Telnet)资源;Gopher资源;WWW资源。
3.按生物医学主题(学科或疾病)划分:
4.按信息资源的来源划分:个人提供的;机构或团体提供的。 (二)网上医学信息资源的特点 1.量大分布广,离散程度高; 2.组织形式多样化; 3.更新速度快; 4.检索方式灵活; 5.规范化程度不高。
六、解释搜索引擎的基本概念
搜索引擎(Search engines)是一些在Web中主动搜索信息(搜索网页上的单词和简短的特定的描述内容)并将其自动索引的Web网站,其索引内容存储在可供检索的大型数据库中,建立索引和目录服务。
七、熟悉搜索引擎的类型及意义 Internet上的搜索引擎数以千计,它们可以按语种(中文、西文)、检索内容(信息服务、软件、寻人)、检索方法(分类检索、概念检索、关键词检索、综合检索)、检索功能(单搜索引擎、多搜索引擎)、专业范围(一般主题、医学主题)分成若干类型。
搜索引擎既是用于检索的软件又是提供查询、检索的网站。所以,搜索引擎也可称为Internet上具有检索功能的网页。搜索引擎正是为解决如何在网上快速有效地获取信息资源这一问题而出现的。
八、列举网上一般主题或医学主题指南和搜索引擎
1.一般主题指南及搜索引擎:Alta Vista;Yahoo;InfoSeek;Excite;Lycos;Webcrawler;Open Text;搜狐(SOHU);天网(WebGather);网络指南针;悠游。
2.医学主题指南及搜索引擎:MedSite;MEDguide;HealthWeb;HealthAtoZ;MedExplorer;MedWeb;Med Engine;Medical Matrix。
九、熟悉网络文献数据库PUBMED的检索方法与技巧
1. PubMed的基本检索运算规则:自动转换匹配功能、短语检索。
2. PubMed检索方法与技巧:(1)基本检索;(2)字段或条件检索;(3)预检索及浏览索引检索;(4)检索史的管理;(5)主题词浏览检索;(6)期刊浏览检索;(7)检索结果的输出;(8)引文匹配器;(9)临床查询(Clinical Queries)。
十、了解电子期刊全文数据库:ScienceDirect OnSite《Elsevier电子期刊全文数据库》;ProQuest《保健、医学与药学电子期刊全文数据库》;CNKI《中国期刊全文数据库》
第九章 文献信息的利用 考试范围
一、熟悉文献信息调查研究的概念、特点和作用 文献信息调查研究又称文献信息分析研究(简称文献信息调研),指以文献信息为对象,有目的的收集文献信息并对其内容进行识别、整理、分析、综合、选择、最后加工出新的文献信息的一种创造性劳动。
文献信息调查研究的特点:针对性、科学性、性、时间性、综合性、预测性。
文献信息调查研究的作用:1.提高决策和科研选题的科学化水平;2.科技项目的查新咨询工作;3.促进科学技术的交流;4.科学技术转化为生产力的桥梁。
二、解释综述的概念
是就某一问题或某些问题,从一定时期内相当大量的专门选定的原始文献中摘取情报,利用这些情报对问题进行综合性叙述,这样写成的经过综合加工的文章叫综述。
三、熟悉综述的类型及格式
1.综述的类型:(1)动态性综述;(2)成就性综述;(3)简述性综述;(4)争鸣性综述。 2.综述的格式:题目、作者和作者单位、摘要、前言(序言)、主体部分、总结、参考文献。
四、熟悉学术论文的特点及写作过程
1.学术论文的特点:科学性、创新性、实用性、文学性。
2.学术论文的写作过程:(1)选择研究课题;(2)文献信息检索和分析;(3)确定课题的研究目标;(4)拟定方案;(5)分析论证。
3.学术论文的格式:标题、著者及著者单位、摘要、关键词、绪论、资料与方法、结果、讨论、结论、参考文献和致谢。
五、熟悉文摘的概念、类型、编写格式和步骤
1.文摘的概念:是以提供文献内容梗概为目的,不加评论和补充解释、简明、确切地记述文献重要内容的短文。
2.文摘的类型:报道性文摘;指示性文摘;选择性文摘;结构式文摘。
3.文摘的编写格式:(1)研究目的;(2)研究方法;(3)研究结果;(4)研究结论。
4.文摘的编写步骤:(1)通读原文;(2)精读原文;(3)分析提炼;(4)反复审核校对。 六、熟悉文献信息调研的基本方法与步骤
(一)文献信息调研的基本方法:1.定量研究方法;2.定性研究方法;3.定量与定性相结合的方法
(二)文献信息调研的步骤:
1.选择和确定课题
2.制定文献信息调研计划
(1)课题调研的目的;(2)调研大纲;(3)组织分工;(4)制定调研时间与实施步骤;(5)调研成果的表述形式
3.文献信息的收集和调研
4.文献信息的整理、鉴别和评价 5.文献信息的分析
6.撰写调研报告
谢志耘:同学们,今天的文本辅导就到这里,谢谢大家!大家如有疑问,可以给我发电子邮件。我的电子邮件是:xiezy@bjmu.edu.cn
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- igat.cn 版权所有 赣ICP备2024042791号-1
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务