第二章 文献检索基本知识
DESCRIPTION
第二章 文献检索基本知识. 一、文献检索的基本概念. 信息检索: 广义 :将信息按照一定的方式组织和 存 储起来,并根据 用户的需求 找 出有关信息的过程。 狭义 :指用户 找 出有关信息的过程。. 信息检索的类型 (根据不同的检索对象): 数据检索 :检索的结果是数据。 如 某种材料的电阻;某变压器的参数;化学分子式、数据图表等 <手册> 事实检索 :检索的结果是事实结论。查询某一事物(事件)的性质、定义、原理以及发生的时间、地点过程等。 如某产品是哪个厂家生产,哪个牌子的最好;第一颗人造卫星是什么时候升空的 <年鉴> - PowerPoint PPT PresentationTRANSCRIPT
第二章 文献检索基本知识第二章 文献检索基本知识
信息检索:信息检索:
广义:将信息按照一定的方式组织和存储起来,并根据 用户的需求找出有关信息的过程。
狭义:指用户找出有关信息的过程。
一、文献检索的基本概念
信息检索的类型信息检索的类型(根据不同的检索对象):
数据检索:检索的结果是数据。如某种材料的电阻;某变压器的参数;化学分子式、数据图表等<手册>
事实检索:检索的结果是事实结论。查询某一事物(事件)的性质、定义、原理以及发生的时间、地点过程等。如某产品是哪个厂家生产,哪个牌子的最好;第一颗人造卫星是什么时候升空的<年鉴>
文献检索:以文献为检索对象,将文献按一定方式组织和存储起来,并根据用户的需要找出有关文献的过程和技术。检索的结果是文献资料。查找相关文献的内容、出处、收藏单位等。如系统地查找水压伺服控制阀原理方面的相关文献<论文>
信息检索 (Information Retrieval) 与文献检索 (Document Retrieval) 是两个不同的概念,文献检索是信息检索的一种最基本的、最主要的形式。
文献检索的主要研究内容 研究对象--文献;研究对象--文献; 检索工具和检索系统检索工具和检索系统 ;; 索引语言和索引方法;索引语言和索引方法; 检索方法、服务方式等。检索方法、服务方式等。
二、文献检索的原理:
提问(检索)语言
文献标识语言
匹配
主题概念
文献标识
主题概念
检索表达式
文献内容
主题分析
检索工具(系统)
用检索语言对文献进行描述
检索需求
主题分析
用检索语言对文献进行描述
是否匹配否
输出结果为零
得到检索结果
是
检索原理图
情报工作人员
检索者
(提问标识)
文献存储过程 检索过程
大功告成
晕啊,重来一遍
三、检索语言:根据信息检索需要创造的一种人工语言
描述文献外部特征的语言
描述文献内容特征的语言
题名语言:一般按题名字顺逐字排检
著者语言:一般按姓前名后的字顺逐字排检
号码语言:如专利号、标准号、 ISBN 号、 ISSN号
分类语言:根据学科内容等对文献进行分类。如图书分类号、国际专利分类号、标准分类号等
主题语言:自然语言,人工语言
自然语言:自然表达某一概念的语言,没有强制性的规定。通俗地说,就是对于一个概念你想怎么表达就怎么表达。在文献检索中,关键词 (key words) 等用的就是自然语言 .
人工语言:人为规定的概念表达语言。通俗地说就是对于一个概念你必须使用规定的语言来表达。在文献检索中,主题词 (subject) 通常用的就是人工语言
11 、、中国图书馆图书分类法(中图法)中国图书馆图书分类法(中图法)
为全国公共图书馆和信息研究所等机构所采用,是我国通用的综合性书资料分类法。1973年试用版, 1975年第一版, 1980年第二版, 1990年第三版, 1999 年第四版。共分 22个大类例如:
A 马、列、毛、邓 B 哲学、宗教 S 农业科学 T 工业技术 TN 无线电电子学电信技术 TN.3 半导体技术
图书分类号
中国图书馆分类法(中图法)中国图书馆分类法(中图法)
基本 22 大类
A 马列毛邓
B 哲学宗教
… T 工业技术T 工业技术
TB一般工业技术TB一般工业技术 TD矿业工程
TE石油天然气工业
…
TV 水利工程TB1
工程基础科学
TB2工程设计与绘测
TB3工程材料学
TB3工程材料学
… TB9测量学
TB30工程材料一般性问题
TB31金属材料
… TB37 耐腐蚀材料
Z综合性图书
…
四、检索工具定义:定义:是人们用来存储、报道和查找文献的工具。因此它具有存储和检索的功能
特点:特点:
详细地著录了文献的外部特征和内容特征
具有既定的检索标识,如主题词、分类号、作者姓名等
全部文献根据标识系统地科学地排列,成为一个有机的整体
提供多种检索途径
检索工具的作用集中组织,提高检索效率缩短检索过程,节省时间,提高检索速度多角度检索消除语言文字障碍
书本式检索工具
卡片式检索工具:(很少用)
缩微式检索工具:(很少用)
机读式的检索工具:(磁带等已很少用)现在常用的检索工具如 网络、光盘数据库等
检索工具的形式:检索工具的形式:期刊式:连续性,具有期刊的出版特点
单卷式:独立性,以一定的专题为内容
附录式:不单独出版,附于书刊之后
检索工具的类型:检索工具的类型:1、目录型检索工具:按一定次序编排,仅提供检索线索
常见的几种目录型检索工具
1 )国家书目:是一种不加选择地记载一个国家出版的全部图书的目 录,可反映一个国家的出版业水平
2)馆藏目录:同图书馆、情报所等单位自己编制的本馆藏书、资料 的目录
3)联合目录:是汇总若干图书馆或其它收藏单位所藏书的目录
4)出版社目录:是根据出版社出版的图书或书店发行的图书馆编制 而成的目录
2 、文摘型检索工具:简明扼要地报道文献内容的检索工具,不包括对原文的补充、解释或评论。
文摘可以揭示文献内容,吸引读者阅读原文。是二次文献的核心,检索工具的主体。
文摘的类型: 报道性文摘:文献的核心内容,一般为 400 - 500字,必要时可
增至 1000 - 2000字。有时读文摘可取代读原文。
指示性文摘:又称简介,对标题的补充说明,起到解题的作用。不能替代阅读原文。
专用文摘:指各种专业文摘机构根据各自的专业特点和读者要求而规定的文摘形式。所反映的不是原文内容的全部观点,而是与本专业有关的那一部分。
文摘型检索工具著录格式
3 、题录型检索工具:
题录:由一组著录项目构成的一条文献记录。
与目录的区别:目录以一个完整的出版单位为著录单位,题录通常以“篇”为基本著录单位,所提示的文献深度较目录强
与文摘的区别:不带文摘,其他一样。所揭示的文献深度不如文摘,但较文摘快,可以弥补文摘型检索工具收录文献不够全面和出版较慢的缺点。
题录型著录格式
4 、文献指南和书目之书目
文献指南:主要是介绍某一类型的一次文献的检索方法,以及介绍利用图书馆的一般方法。如《参考书指南》
书目之书目:检索工具的目录。
注:对于计算机检索来说,有的数据库可以直接获取全文,称为全文型数据库,即全文型的检索工具
中文科技文献常见检索工具(手工)举例:中文科技文献常见检索工具(手工)举例:
《全国总书目》 ----- 查找国内出版图书的基本工具
《外国科学技术新书征订目录》 ----- 查找外国原版新书的 工具
《全国西文期刊联合目录》 ----- 查找西文期刊最全的工具
《全国报刊索引》(自然科学版) ------ 查找报刊论文的题 录式检索工具,容量最大,门类最广
《中国学术会议文献通报》 ----- 以文摘、题录的形式报道 全国科技会议论文
《中国专利公报》 ------ 查找国内专利的检索工具
五、参考工具书(属于三次文献)
工具书是一种将汇集、编著或译述的材料,按特定的方法加以编排,以供解释疑难时查考之用的图书
从汉代的《尔雅》《说文》至今,中文工具书已有 2000 多年的历史
工具书的特点工具书的特点 内容上具有完整性
在编排方法上具有易检性
目的功用上具有查考性
辞书(字典、词典 ) 类书
百科全书 年鉴
手册 书目
索引 表谱
图录、地图 名录
政书
中文工具书主要主要类型中文工具书主要主要类型::查考事物的起源,典故的出处,诗词文句,参考史料,校勘古籍及辑录散佚。
典章制度专史,记载古代典章制度的沿革及政治、经济、文化发展的情况
以编年或表格形式记载事物发展的工具书
辞书:辞书:字典、词典、辞典的统称
词和辞的区别:
收录语文词汇为主的称词典;收录术语、专有名词、学科性词汇为主的称辞典
百科全书:百科全书:百科全书是知识的总汇,是一切知识门类广泛的概述性著作。包括综合性百科全书(如中国大百科全书)专业性的百科全书(如中国企业百科全书)
是否有一部优秀的综合性的百科全书,常常是衡量一个国家科学文化发展水平的尺度
百科全书由若干条目条目组成。条目是百科全书的基本知识单元,是独立的概念或完整的知识主题。也是基本的检索单元。
条目一般包括条头、释文、参考书目
此外还有前言、插图、附录(如大事年表)和索引等
现代百科全书的特点现代百科全书的特点::1 、概述知识条目化
2、条目编排词典化:按标题的字母顺序排列;有完整的检索系统
3、百科全书内容要求较强的稳定性,具体指标:全书 70—80%的内容能 够有大约 10年的参阅价值。为了适应知识不断更新的需要,现代百 科全书修订制度主要有再版制、补卷制、连续修订制
4、百科全书由专家撰写、审定,具有较高的可靠性和权威性。其内容 浩瀚,往往要投入大量的人力、物力,需较常的出版时间,因此, 它难以及时反映最新科技研究动向及发展,为此,不少百科全书出 版社出版相应的百科年鉴来作补充
现代百科全书往往逐年编辑出版年鉴,及时反映年度大事、学科进展、事实数据。形式上,年鉴不是对百科全书的直接修订,但内容上补充百科全书的不足,为全面修订积累资料
百科全书的编排:百科全书的编排:
1 、分类编排:按学科分类(较少采用)
2、字顺编排:按条目首字的拼音或笔画顺序
3、分类和字顺相结合的编排方式
中国的百科全书:中国的百科全书:
20世纪初传入我国, 80年代发展起来
典型代表:《中国大百科全书》 该书由中国大百科全书出版社出版,从 1980年开始到 1993年陆续完成。这是我国第一部现代大型综合性百科全书,其总编辑委员会有 100 多专家组成,撰稿 2万人。
全书共有条目 7.8万,文字 125 百万,插图 5万,内容有许多与科学技术有关。
全书按学科共分为 74 卷,其中 73 卷为正文, 1卷为索引。
正文包括:数学、物理学 (2 卷 ) 、力学、化学 (2 卷 ) 、天文学、地质学、固体地球物理学 .测绘学 .空间科学、大气科学 .海洋科学 .水文科学、地理学、中国地理、世界地理、生物学 (3 卷 ) 、现代医学 (2 卷 ) 、中国传统医学、农业 (2 卷 ) 、水利、交通、矿冶、机械工程 (2 卷 ) 、土木工程、建筑 .园林 .城市规划、电工、电子学与计算机 (2 卷 ) 、自动控制与系统工程、航空 .航天、化工、轻工、纺织、环境科学经济学 (3 卷 ) 、财政 .金融 .税收 .物价、哲学 (2 卷 ) 、宗教、心理学、政治学、社会学、法学、军事 (2 卷 ) 、民族、中国历史(3 卷 ) 、外国历史 (2 卷 ) 、考古学、中国文学 (2 卷 ) 、外国文学 (2 卷 ) 、美术 (2 卷 ) 、音乐 .舞蹈、戏剧、戏曲 .曲艺、电影、教育、语言 .文字、新闻 . 出版、文物 .博物馆、图书馆学 .情报学 .档案学、体育。
《中国大百科全书》简明版《中国大百科全书》简明版 1998年又出版了第 2 版 (简明版 ) (ISBN: 7 - 5000- 5903 - 5) ,全书共 12 卷,按拼音顺序编排
光盘版光盘版 1999 年北京东方鼎电子有限公司制作了中国大百科全书图文数据光盘,集 74卷书于 24张光盘之内,共收 66个学科,条目 77895 条,约 12568万字,绘制图表 49765幅,具有分类目录检索,主题词目录检索,拼音目录检索,外文目录检索,模糊检索等十余种检索功能,等于拥有了一个小型家庭图书馆。光盘的最新版本为 1.1版,于 2000年 10月出版,共 4张光盘,包含 66个学科, 8万个条目, 1.264亿汉字, 5万余幅图片。
六、检索途径(和检索语言相对应,也是手工检索工具的编排方式):
已知文献线索: 著者途径(著者名、机构名)
题名途径(书刊名、文献名) 序号途径(标准号、专利号)未知文献线索: 分类途径(分类号) 主题途径(主题词):用表达内容方面的词作检 索,表达比较灵活,是最主要的检索途径
经济管理
教育科学
工程技术
农业科学
医药卫生
……
一般工业技术
矿业工程
能源与动力工程
自动化与计算机技术
……
分类检索分类检索(手工检索通过分类号,计算机检索通过浏览功能)
自动化基础知识
自动化与计算机技术及设备
智能控制、机床
start
主题检索主题检索
手工检索:查找主题词(通常按字顺排列)
计算机检索:在题名.关键词等字段中输入表达检索内容的词
智能控制 and 机床
1 数控机床智能控制系统鲁棒性策略研究
2 神经网络在数控机床智能控制中的应用
检索过程:检索过程:分析研究课题选择检索工具确定检索途径,选择检索方法查找文献线索获取原文
找到文献线索后图书馆是否购买全文的电子版文献网上是否有免费的全文下载(较少)本馆馆藏馆际互借(或自已到相关信息服务机构复印)
论文的参考文献、文摘型数据库等
图书馆或文献信息中心根据共享资源的原则建立一种协议合作关系,对彼此的用户提供免费或者有偿的信息资源共享服务,以实现信息资源的合理调配,从而提高信息资源价值的最大化利用。
去馆藏单位借阅或复印 (由近及远的原则) 本馆馆际互借合作单位、本市公共信息服务机构其他地区包括国外
馆际互借 * 网上全文下载(计算机检索) 联机借阅:通过联机直接向原文单位发出借阅命令(如 OCLC系
统) 联机订购:由联机检索系统和信息公司联手提供服务(网络数据库、
电子期刊等)
原文索取方式原文索取方式
A 《美国百科全书》 (Encyclopedia Americana) 1991 年中文版由光复书局出版。
B 《新不列颠百科全书》 (The New Encyclopaedia Britannica)
C《科利尔百科全书》( Collier‘s Encyclopedia)
世界上被称为 ABC百科全书( the ABCs)
世界三大百科全书(世界三大百科全书( ABCABC))
《新不列颠百科全书》 (The New Encyclopaedia Britannica) 该书也称《大英百科全书》,由 Encyclopaedia Britannica公司出版,该书的初版于 1768年问世,最新版本于 1999 年出版 (ISBN: 0-85229-663-0) 。它是世界历史比较长、影响最大、最著名的一部综合性百科全书,一直是西方世界最权威的综合性百科全书。
内容侧重人文、社科,但近几年科技方面的内容有所增长。 本世纪初,该书的版权转让给美国。它一直标榜它的“国际性”,因为参与条目撰写的专家遍布全球一百多个国家。它的“权威性”更不容忽视,它广泛邀请诺贝尔得奖人级别的人物参与写作。
《美国百科全书》 (Encyclopedia Americana)
该书的初版由美国 Grolier 公司于 1829 年出版, 2001 年最新版 (ISBN: 0-7172-0134-1)已经出版,全书共分30 卷。书中内容是世界性的,但偏重北美的人文、历史,有相当的科技含量。条目按名称字顺编排,
Grolier 公司于 1996年推出该书的全文光盘,现已有 1999 年的最新版本。 1997年又推出联机网络版《 Encyclopedia Americana Online》。
《科利尔百科全书》(共 24 卷)是 20世纪新编的大型英语综合性百科全书。《科利尔百科全书》的特点是:适用对象广泛,释文通俗流畅,可读性高;材料更新及时,内容较新而且可靠;参考书目的编选为各家百科全书之冠;分析索引范围深广,索引条目为正文条目的 16倍;本书编辑意图强调教育性。
网上资源——百科全书
1 不列颠百科全书网络版 http://www.eb.com 2 维基百科 http://wikipedia.jaylee.cn/ 3 Encyclopedia.com http://www.encyclopedia.com 4 百度百科 http://baike.baidu.com/ 还有更多。。。。。。
年鉴年鉴 (annual, yearbook, almanacs)(annual, yearbook, almanacs) ::系统汇集上一年度重要时事文献、学科进展与各项统计资料,以供人查阅的工具书。
包括最新的资料、详尽的数据,涉及政治、经济、文化、科技各个领域。按年度编辑出版。其数据资料主要来源于政府文件、权威性报刊及各类统计报告。
特点:以年为限,报道上一年的大事、动态、逐年编辑,连续出版,记事为主,资料丰富、新颖、系统、准确
年鉴的类型:年鉴的类型:
从内容上分有:综合性年鉴,如《中国百科年鉴》、《香港年鉴》《世界知识年鉴》等;专业性年鉴,如《中国文艺年鉴》、《中国出版年鉴》、《中国统计年鉴》等
从编写方式上分有:有记述型年鉴,统计型年鉴
手册:手册: (Handbook, Manual) 是一种便捷式参考书 (Ready Reference Book), 它的信息、知识密集,是些经常要查阅、参考的资料和数据。 特点:特点:是确定的、经典的科技知识,要求知识的成熟与确定,不要求最新动态
类型:综合性和专业性,以专业性为主。类型:综合性和专业性,以专业性为主。专业性手册包括:数据型手册、知识型手册、设计手册以及产品手册等
数据型手册提供各种常数、参数、计算公式、曲线、图表、图示、线路图等,是一种简明、实用的检索工具
知识型手册以文字叙述为主 , 阐述科学原理、专业技术、物化性能等学科知识,也配有适当公式和图表,它们既可检索,也可阅读
设计型手册为科技人员、专业设计人员提供所需知识和数据,是他们在工作中经常使用的工具。产品手册具有产品说明书作用,介绍产品名称、技术指标、标准、生产厂商等
六盘水师范学院图书馆工具书库位于图书六盘水师范学院图书馆工具书库位于图书馆五楼右侧,馆藏有全套馆五楼右侧,馆藏有全套 15001500 册册 19871987 年年上海古籍出版社影印版四库全书,以及各上海古籍出版社影印版四库全书,以及各种年鉴、手册、词典等工具书,目前该库种年鉴、手册、词典等工具书,目前该库正在进行紧张的数据著录工作,预计正在进行紧张的数据著录工作,预计 20122012年可正式接待读者提供检索服务。该库工年可正式接待读者提供检索服务。该库工具书只供查询检索,不提供外借服务。具书只供查询检索,不提供外借服务。
七、检索方法1 、直接检索法:直查法 ,不使用检索工具或检索系统直接浏览或查阅。2、间接法检索法:常用法,利用检索工具查找文献。顺查法、倒查法、抽查法3、追溯检索法:利用参考文献深入查找文献。4、循环检索法:又叫分段法,即常用法 +追溯法
八、检索技术1 、布尔逻辑运算符
( 1 )逻辑“与”:“ AND” 或“ *” 表示。如“ A AND B” 或“ A * B” 。检索结果为 A 和 B 的交集。如图:
B A
八、检索技术( 2 )逻辑“或”:“ OR” 或“ +” 表示。如“ A OR B”或
“A + B” , 检索结果为 A 与 B 合并相加部分。如图:
B A
八、检索技术( 3 )逻辑“非”:用“ NOT” 或“ -” 表示,如“ A NOT B” 或“ A-B” ,检索结果为集合A 中排除概念 B 内容的文献,如图:
B A
八、检索技术2 、位置运算符
With 运算符,用( W )或()表示; n Words 运算符,用( nW )表示; Near 运算符,用( N )表示; nNear 运算符,用( nN )表示; Field 运算符,用( F )表示; Subfield 运算符,用( S )表示;
八、检索技术2 、位置运算符
Link 运算符,用( L )表示; Citation 运算符,用( C )表示; 注:在位置运算符和逻辑运算符混合组
配时的运算次序为:先算括号内的,然后是位置运算符,最后是逻辑运算符。
八、检索技术3 、截词运算符:学用“ +” 、“ *” 、“?”表示,所代表字母的个数依不同的检索系统而有不同。
( 1 )前方一致 ( 2 )后方一致 ( 3 )中间一致 ( 4 )完全一致 ( 5 )指定位数一致 截词运算符可以提高查全率
八、检索技术4 、字段限定检索
指限定检索词在数据库记录中的一个或几个字段范围内查找的一种检索方法。
在多数检索系统中,如果用户不对检索式注明字段限定范围,系统默认在 4 个基本字段(篇名、文摘、叙词、自由标引词)中检索
八、检索技术5 、加权检索
对每个检索词加“权”,即赋于一定的数值。系统相应确定一个阈值。如果一篇文献所含检索词的权值大于等于阈值,该文献即被检索命中。如检索词计算机( 5 )、软件( 8 )、应用( 4 ),阈值是 9 ,则:
计算机、软件、应用 权值 =17 ,大于 9 ,命中 计算机、软件 权值 =13 ,大于 9 ,命中 软件、应用 权值 =12 ,大于 9 ,命中 计算机、应用 权值 =9 , 等于 9 ,命中 软件 权值 =8 , 小于 9 ,不命中
九、查全率与查准率查全率:它是指检出的相关文献量与检索系统中相关文献总量的比率,是衡量文献检索系统检出相关文献能力的尺度。它反映该系统文献库中实有的相关文献量在多大程度上被检索出来。
查全率 = [ 检出相关文献量 / 文献库内相关文献总量 ] × 100%
B
九、查全率与查准率查准率:它是指检出的相关文献量与检出文献总量的比率,是衡量文献检索系统检出相关文献能力的尺度。它反映每次从该系统文献库中实际检出的全部文献中有多少是相关的。 查准率 = [ 检出相关文献量 / 检出文献总量 ] × 100%
※ 使用泛指性较强的检索语言 ( 如上位类、上位主题词 )能提高查全率,但查准率下降。
※ 使用专指性较强的检索语言 ( 如下位类、下位主题词 )能提高查准率,但查全率下降。
B
十、检索步骤1 、分析研究课题
( 1 )明确课题要求 ( 2 )明确课题的学科性质、技术内容和其他有关情况。
2 、制定检索策略 ( 1 )选择检索手段 ( 2 )选择检索工具或检索系统及数据库 ( 3 )选择检索方法 ( 4 )选择检索途径和检索标识 ( 5 )构造检索式
3 、试验性检索 快速、少量,检验检索策略是否合理有效
4 、正式检索:灵活运用工具、途径、方法5 、获取原文:多种方式获取原文
第一次作业一、简述文献检索的意义二、说出你想深入了解的科技文献三、信息、情报、文献的概念四、简述文献检索的原理五、谈谈你对图书馆的利用情况