当前位置:首页 >> 其它课程 >>

第二讲计算机检索


第二讲

? 计算机检索原理 ? 世界三大检索系统

? 网络信息检索基础知识
? 数字资源

一、计算机检索原理
1.计算机检索概念
计算机检索:利用电子计算机、高速传输以及高密度存 储技术进行信息检索(存贮或查询)的过程。

人们在计算机检索网络或终端上,使用特定的

检索指令、 检索提问,从计算机检索系统的数据库中检索出所需 要的信息,然后再由终端设备显示、下载或打印。

优点:
(1)检索快捷:处理速度快、运算准确、可靠性高。 (2)多元灵活:采用了逻辑运算和限制检索等功能,使 检索词之间能够灵活地进行组配。 (3)量大面广:可迅速浏览相关领域的所有数据库记录, 网络中每台个人计算机都可成为信息源。 (4)更新迅速:如美国OCLC网络的First Search检索系 统,新刊出版后3天内,即可出现。 (5)资源共享:利用本地计算机可以查询、获取网上丰 富的信息资源,实现资源共享。 (6)方式多样:提供联机回溯检索、定题检索、联机订 购、直接获取全文等多种服务,可按要求输出。

2.信息检索系统
计算机信息检索系统构成: ? ? ? ? ? 服务器 通信网络 检索终端 系统软件 数字资源

(1)服务器
? 服务器是检索系统的核心

部分,在检索过程中需要 处理大量的指令和数据。 ? 服务器要具有较高的运算 速度和处理能力,并且具 有相当大的信息存储容量。 ? 服务器决定了系统的检索 速度和存储容量。

(2)通信网络
? 通信网络是终端与服务 器之间的桥梁,其作用 是确保信息传递的畅通。 ? 国际上大型联机检索系 统的主机与本地区数据 通信网络相联,在网络 上有端口,检索用户通 过网线和网络设备检索 数据库信息。

(3)检索终端 ? 检索终端是用户与检索系统传递信息进行“人—机 对话”的装置,有电传终端、数传终端和微机终端 等。 ? 常用的微机终端,由计算机、打印机以及调制解调 器组成。 ? 调制解调器的作用是把终端的信息在传输前加载到 一个载波信号上(调制),接受时通过检测收到的信 息偏离精确载波信号的程度,分离出原先发送的信 号(称之为解调),以解决信息传输过程中的衰减 问题。

(4)软件
? 软件的作用是充分发挥硬件的功能,进行信息 的存储、处理检索以及整个系统的运行管理。 ? 操作系统软件:Windows2000,WindowsNT等。 ? 数据库管理系统软件:Oracle、Sybase等。 ? 数据库检索软件和阅读软件: ssreader(超星),vip(维普)

(5) 数据资源
? 数据库、电子书刊、网络资 源等。 ? 数据库是一系列信息记录的 集合,是检索系统中的信息 源,它存储在计算机的磁带、 磁盘或光盘上,借助于数据 库的管理软件技术和检索系 统进行利用。 ? 国际上通常将其划分为两大 类:参考数据库、源数据库。

? 参考数据库:指引用户到另一信息源以获 得原文或其它细节的一类数据库。包括:
书目数据库——存储某个领域的二次文献(如文 摘、题录、目录等书目数据)。
指南数据库——存储关于某些机构、人物、出版 物、项目、程序、活动等对象的简要描述,指引 用户从其它有关信息源获取更详细的信息。

? 源数据库:能直接提供原始资料或具体数据 的数据库,用户不必再查阅其它信息源。
数值数据库——指专门提供以数值方式表示的数据 (或包括其统计处理表示法)的一种。 事实数据库——指专门提供事物发展过程中产生的 事实数据。 全文数据库——存储文献全文或其中主要部分,简 称全文库。 术语数据库——专门存储名词术语信息、词语信息 以及术语工作和语言规范工作成果。 图像数据库——用来存储各种图像或图形信息及有 关文字说明资料。

3 .计算机检索的发展

(1)脱机检索(Off-Line Retrieval) ? 脱机检索又称批式检索:用户只需要把检索要求 送往检索中心,由专职计算机人员进行检索。往 往把一批检索提问集中起来,对提问不立即回答, 而是定期成批地在计算机上查找。由于种种缺陷, 已于20世纪60年代末、70年代初渐渐停止使用, 脱机检索系统逐步转化成联机检索系统。 ? 1954年,美国海军武器实验站图书馆在一台电子 管计算机上建立了世界上第一个计算机检索系统。

( 2 )联机检索(Online Retrieval)

使用终端设备,运用一些规定的指令输入检索词和检 索策略,通过通讯网络与相关检索系统直接连接进行" 人机对话",同时通过运行检索软件从信息检索系统的 预先储存文献的数据库中查找所需信息的过程。 优点:1.克服了地理上的障碍;2.消除了时间上的 延迟现象;3.保证检索者获得最新、最及时的文献信 息;4.检索者可修改检索策略,达到一定的查全率和 查准率。 缺点:1.检索费用较高;2.受地区通讯线路质量的 影响较大;3.检索技术较为复杂,难以普及。 20世纪60年代对联机信息检索进行了研究开发试验; 70年代末进入了联机检索地区性应用阶段;90年代以后, 藉以高速信息网络以崭新面貌出现。

(3)光盘检索(CD-ROM SEARCHING) 微机、检索软件、光盘驱动器和光盘数据 库即构成光盘检索系统。 优点是:①使用方便、简单,易于操作; ②不受机时的限制,可反复修改检索策略, 达到很高的检全率与检准率;③检索费用低 廉,没有通讯费用,一次订购,反复使用。 缺点是:①数据更新周期较慢,时差长, 文献的新颖性不够;②同一时间只能一人使 用,资源浪费较大。但是,现在的光盘网络 技术已经解决了这一问题。

(4)网络信息检索(NETWORK SEARCHING)
互联网的发展使人类社会信息的存储、传递、 交流和利用发生了革命性的变化,世界变小 了,实现了全球通讯和资源共享。互联网上 的信息资源呈现爆炸性增长,传统的相对独 立的联机检索系统纷纷变成了互联网上的一 个站点,计算机检索进入了网络信息检索阶 段。

二、世界三大检索系统
1、OCLC (Online Computer library Center)

即联机计算机图书馆中心 2、 DIALOG联机检索系统
世界上最早的专业情报检索系统 3、 STN国际联机检索系统 世界著名的国际联机检索系统之一

1、OCLC (Online Computer library Center)
即联机计算机图书馆中心。总部设在美国的俄亥俄州, 创于1967年。是一非营利性组织,是目前世界上最大的 图书馆和信息中心网络。向64个国家和地区的34775个 图书馆和教育科研机构提供信息服务。

其主要产品和服务:
◆Cataloging and Metadata ◆Collection Management ◆ Reference ◆Digital collection & preservation ◆eContent ◆Resource sharing

2、DIALOG联机检索系统
是世界上最早的专业情报检索系统。最初由美国洛克希
德导弹航空公司所属的一个情报科学实验室建立的自1972 年起开始为用户提供服务,1981年成立子公司,开始独立 经营。中心设在美国加利福尼亚州的Paloalto市

提供的服务项目:
◆各种类型信息检索 ◆定题服务 ◆原文订购等

3、STN国际联机检索系统
该系统创建于1983年,提供完全的科技信息领域的在线服务。 它是由美国化学文摘社CAS、德国卡尔斯鲁厄专业信息中心FIZKarlsruhe和日本科技情报中心JICST共同合作经营的跨国网络数 据库公司,是世界著名的国际联机检索系统之一。
该系统目前有200多个(不断增加的)数据库,涉及化学、工 程、生命科学、生物技术、专利、数学、物理、商业等各基础学 科领域和综合技术应用领域,每个数据库都是本专业领域内的权 威数据库。

三、网络信息检索基础知识 ----认识IP地址和网址
? 人们为了通信的方便给每一台计算机都事先分配一个类似我 们日常生活中的电话号码一样的标识地址,称作网络协议地 址,是分配给主机的一个32位地址,由4个字节组成。分为 动态IP地址和静态IP地址两种。动态IP地址指的是每次连线 所取得的地址不同,而静态IP地址是指每次连线均为同样固 定的地址。如在图书馆无线上网就是动态IP地址,每次所取 得的地址不同。 ? 静态地址如学校网站的IP 通常一经设定,变动较少。 202.196.33.227

网络地址和认识域名
? 虽然可以通过IP地址来访问每一台主机,但是要记住那么多枯燥 的数字串显然是非常困难的,为此,Internet提供了域名 (Domain Name)。
? 域名也由若干部分组成,各部分之间用小数点分开,例如我校主 机的域名是 cn ? 域名前加上传输协议信息及主机类型信息就构成了网址(URL), 例如我校www主机的URL就是:zzti.edu.cn ? 通常,进行网络访问时,域名的www可以省略。如 http://www.edu.cn/,可以直接输入http://edu.cn。不能省略的 与域名服务器的配置有关。

? 域名一般不会变动。

网络地址—网址---URL
URL的构成:(Uniform Resource Location) 由存取协议、主机名、文件名 三部分构成。 ? 存取协议如: HTTP:超文本传输协议;Gopher:gopher协议
一种互联网没有发展起来之前的一种从远程服务器上 获取数据的协议 ; FTP:文件传输协议;

? 主机名是冒号后面从“//”开始到第一个“/”结束 的部分。由多个域名组成,中间用“.”间隔。从 右到左理解,最右边的是最高一级的。如 http://zzti.edu.cn/ ? 最高域名有三类: 一类是两个字符的国家(地区)代码,如cn(中国大 陆)、 tw(中国台湾)、HK(香港)uk(英国)、 ca(加拿大)。

第二类是 国际域名目前只有int(代表国际组织). 第三类是 表示组织或团体的三字符码的通用域名。

常见的通用域名有: com(商业组织)、edu(教育机构)、 gov(政府组织)、org(其他组织)、 mil(军事机构)、inf(信息机构)、 name(个人网站)等。

全世界为美国打工
? 目前,全世界共有13台根服务器,其中10台在美国, 而且2台由美军使用,1台由美国国家航空航天局使 用。也就是说,每天世界各地的电子邮件有很多要 先由美国人“过目”之后才能去它该去的地方。此 外,美国私营公司掌握着全世界互联网域名的分配 大权。假如美国与日本的关系急剧恶化,只要美国 通过技术手段删去日本的域名“. jp”,日本马上就 会成为“网上孤岛”,无法通过网络与外界联系。 全世界的网络用户都要向美国支付费用,“全世界 都在为美国打工”。

更多……
? www指的是什么? 即是万维网(WWW-World Wide Web):是基于超文件 的、方便用户在因特网上搜索和浏览信息的信息服务系 统。它将位于全世界因特网上不同地点的相关数据信息 有机地纺织在一起。媒体形式可以是文本、图片、动画、 声音等,可以跳转,“网上冲浪”。 ? 浏览web信息的网络浏览器有哪些? 微软IE (Internet Explorer ) 遨游(maxthon) 火狐(FireFox ) 网景(Netscape) 腾讯TT浏览器

微信息
? ? ? ? ? ? 由网民(草根)创建和传播,具备个人色彩; 区别于传统出版和发行形式的网络信息资源; 这类信息数量大、创建和消亡难以监控 经常见到信息重复、信息评价困难 组织管理和利用比较困难 信息形式多样,长短不一,而且大多比较短。
这些内容均可称为微信息,如:BBS(Bulletin Board System,电子公告板。)论坛、贴吧、社区、BLOG、WIKI(维基 或维客。一种多人协作的写作工具指一种超文本系统。)TAG (称之为“分类”,“开放分类”或“大众分类”,还有的称之 为“标签”。Tag(标签)是一种更为灵活、有趣的日志分类方 式。 )

网络常见语录
? ? ? ? 开放、参与、整合 人人为我,我为人人 草根的天下,英雄的摇篮 一种态度,而不仅仅是技术

万维网上的来“客”
? ? ? ? ? ? ? ? ? ? 博客(牛客 、贝贝客 ) 播客 维客 晒客 印客 闪客 黑客/红客 威客 拍客 调客 “客”:一类人

四 数字资源
? ? ? ? 综合性数字资源 检索图书的数字资源 检索期刊的数字资源 检索特种文献的数字资源

1、综合性数字资源
(1)中国知网(中国知识基础设施, CNKI )
国家知识基础设施的概念,由世界银行提出于1998年。 CNKI工程由清华大学、清华同方发起,始建于1999 年6月。采用自主开发并具有国际领先水平的数字图 书馆技术,建成"CNKI数字图书馆",并正式启动建 设《中国知识资源总库》及CNKI网格资源共享平台, 通过产业化运作,为全社会提供信息资源和数字化 学习平台。

1)中国期刊全文数据库
? CNKI系列全文数据库之一,它收入1994年至 今国内公开出版的七千多种核心期刊和专业 特色期刊的全文, 按学科内容分十大专辑,分 别是:理工A(数理化天地生)、理工B(化 学化工能源与材料)、理工C(工业技术)、 农业、医药卫生、文史哲、经济政治与法律、 教育与社会科学 、电子技术与信息科学。

2)中国优秀硕士/博士学位论文全文 数据库

3)中国重要会议论文全文数据库

4)期刊导航

(2)万方数据资源系统
? 以中国科技信息研究所(万方数据集团公司)全部信 息资源为依托建立起来的。1997年8月在国际互联 网上投入服务。 1993年注册成为中国第一家数据库 专业公司。 ? 网址:http://www.wanfangdata.com.cn/ ? 以科技信息为主,集经济、金融、社会、人文信息 为一体。分科技信息系统、数字化期刊、企业服务 系统、医药信息系统4部分,拥有100多个数据库。 ? 收录范围涉及期刊、会议、文献、书目、题录、报 告、论文、标准、专利、法规等。 ? 可以单库、跨库检索,也可以在所有数据库中检索, 还可以按行业检索。

(3)读秀学术搜索
? 提供230多万种中文图书搜索(书目数据是国 内收录最全、最新的,占建国后所出版图书的 95%以上); ? 提供180多万种(近6亿多页)中文图书文全文 检索与阅读; ? 提供期刊、报纸、学术论文、会议论文的联合 检索; ? 书目检索提供图书试读(书扉页和正文部分页 试读),检索结果“提供文献传递服务”。 ? 单次咨询不超过50页,一周咨询总量提供不超 过整本图书的20%的传递服务。

(4)中国高等教育文献保障系统
? China Academic Library & Information System,简 称CALIS,是国务院批准的我国高等教育“211工 程”中公共服务体系之一。宗旨是把国家的投资、 现代图书馆理念、先进的技术手段、高校丰富的文 献资源和人力资源整合起来,建设以中国高等教育 数字图书馆为核心的教育文献联合保障体系,实现 信息资源共建、共知、共享,以发挥最大的社会效 益和经济效益,为中国的高等教育服务。 ? CALIS管理中心设在北京大学,下设了文理、工程、 农学、医学四个全国文献信息服务中心,华东北、 华东南、华中、华南、西北、西南、东北七个地区 文献信息服务中心和一个东北地区国防文献信息服 务中心。

(5)DIALOG检索系统
? DIALOG系统于20世纪60年代由美国洛克希德导弹与 空间公司创建,该系统以其检索软件命名。1972年开 始为世界各地的用户服务,成为第一个商用数据库。 1981年正式成为洛克希德公司的子公司,开始独立经 营。 ?1989年成为Knigth Ridder公司的子公司,后来又几易 其主,现在与ISI、Derwent、Janes、Gale Group等都 隶属于Thomson集团。 ?Dialog已经成为世界上最大、最完善、历史最悠久的 在线数据库信息服务公司。

(6)STN检索系统?

STN系统(The Scientific and Technical Information Network-lnternational)系统由美国化学文摘社(CAS), 德国卡尔斯鲁厄专业信息中心(FIZ Karisruhe)和日本 的国际化学信息协会(JALCI)多家合作。 该系统目前有200多个(不断增加的)数据库,涉及化学、 工程、生命科学、生物技术、专利、数学、物理、商 业等各基础学科领域和综合技术应用领域,每个数据 库都是本专业领域内的权威数据库 该系统用菜单驱动操作,响应速度快。收费低是STN的竞 争手段之一。

(7) OCLC检索系统 ? OCLC(联机计算机图书馆中心——Online Computer Library Center)始建于1967年,总部设在美国俄亥 俄州都柏林。它是一个面向图书馆的非赢利组织, 以推动更多的人检索信息,实现资源共享。 目前,它拥有15个主题范围的80多个数据库,其中30 多个数据库可检索到全文,总计包括6000多种期刊 的联机全文和2100多种期刊的电子映像,共达600万 篇文章的全文。 OCLC中最具特色的数据库是联机联合书目库(OCLC Online Union Catalog)和期刊全文数据库,前者集中 反映了世界上76个国家和地区的39517个图书馆的馆 藏信息;后者收录了2100余种连续出版物的300万篇 论文。

2、检索图书的数字资源
1)超星数字图书馆
超星数字图书馆成立于2000年,并于当年发行超星读 书卡; 2000年5月超星数字图书馆被列为国家863计 划中国数字图书馆示范工程; 自2001年以来连年获 得“国家优秀文化网站”的荣誉称号。 目前是中国最大的网上数字图书馆,收集了国内各公 共图书馆和大学图书馆以PDG技术制作的数字图书。 超星数字图书馆馆藏图书已达50万册以上,以工具类、 文献类、资料类、学术类图书为主。 网站每天100册新书。

2)书生之家 “书生之家数字图书馆”是建立在中国信息资源平台 基础之上、集数据库应用平台、信息资源电子商务 平台与资源数字化加工服务平台三位一体的综合性 数字图书馆。资源内容分为书(篇)目、提要、全 文三个层次,提供全文、标题、主题词等十种数据 库检索功能。 收录入网出版社500多家、期刊7000多家、报纸1000多 家。每年收录新出版中文图书30000本,期刊文献60 万篇,报纸文献90万篇。并根据中国图书馆分类法 进行组合,将图书、报纸、期刊、论文等不同种类 文献真正融合在一起,可以进行全文检索、文本摘 录、四级导航等,便于读者检索利用。

3)四库全书电子版

3、检索期刊的数字资源
1)维普全文电子期刊
由重庆维普资讯公司制作并提供服务的。重庆维普资 讯公司隶属与中国科技信息所西南信息中心,是我 国最早进行数据库加工出版的单位之一。自1999年 起,维普资讯公司开始进行期刊论文全文的加工制 作和服务。 收录了9000余种期刊,学科覆盖理、工、农、医、教 育、经济、图书情报等多个领域。采用其特有的格 式制作及传播,用户使用时必须首先下载并安装其 期刊全文阅读器——维普全文阅读器才可对期刊全 文进行浏览和阅读(点击每篇论文的篇名链接即可 获取全文)、也可进行打印及下载。 河南省联合使用。

2)施普林格(Springer-Link)外文电子期刊数 据库 德国施普林格(Springer-Verlag)是世界上著名 的科技出版集团,LINK是施普林格出版社和 它的合作公司推出的科学、技术和医学方面 的在线信息资源。 图书馆以联合购买的方式,拥有在线阅读的权 限,可在线阅读500余种电子期刊。期刊学科 范围包括:化学、计算机科学、经济学、工 程学、环境科学、地理科学、法学、 生命科 学、数学、医学、物理和天文学。

3) EBSCOhost外文期刊全文数据库
图书馆以联合购买的方式,拥有在线阅读的权限。 ①Academic Search Premier是当今全世界最大的多 学科学术期刊全文数据库,专为研究机构所设计, 提供了7876种期刊的文摘和索引,3990种学术期刊 的全文,其中100多种全文期刊回溯到1975年或更 早。涉及领域:社会科学、人文科学、教育学、计 算机科学、工程学、物理学、化学、语言学、艺术、 文学、医学、种族研究等。 ②Business Source Premier收录了3048种学术性商 业类全文期刊,文摘和索引的收藏更超过3851种期 刊。学科领域包括:管理、市场、经济、金融、会 计、国际贸易等。Business Source Premier包括 世界上最著名的商业类期刊。

4)IEEE-CS数据库

? 23种计算机核心期刊,回溯到1988年 ? 1700多种会议录,回溯到1995年,包括与 ACM合作出版的会议录 ? 另有2种网络版期刊 ? 超过150,000篇专业文章和论文,提供全部文 本、图形图像、完整方程式,及其它更多资 料 ? 电子文献可以在印刷品出版前阅读。

4、检索特种文献的数字资源
1)中国专利信息网 (http://www.patent.com.cn/)
始建于1998年5月,于2002年1月推出新版。集专利检 索、专利知识、专利法律法规、项目推广、高技术 传播、广告服务等功能为一体。 专利检索:实时了解和中国专利相关的任何信息,方 便查询专利的详细题录,下载专利全文资料。链接 到世界各主要国家、地区和组织的专利网站。 项目转让:提供有关专利技术转让的一切资料。 同 时提供了一个展示专利技术的平台。 发明园地:发布发明设想、创造灵感,寻求合作伙伴。

2)起点自主考试学习系统
? 本系统是一个包含英语、计算机、公务员考 试、司法考试等的整合性模拟学习平台。具 有界面友好、操作简单、功能完善等特点。
? 本系统由以下7部分组成;试卷、随机组卷、 专项训练、模拟考场、自建库、我的资料、 后台管理。

3)网上报告厅 ( http://202.196.33.228/adksvod/ )
北京爱迪科森制作,有机整合了中央党校、中央电视 台、清华大学、中华医学会、中国经济50人、中评 网、解放军卫生音像出版社论坛等权威学术机构的 专家报告资源。 分为《理工系列》、《经管系列》和《综合素质》等 内容。 可以分类检索,还可通过“主题”或“主讲人”对视 频资源进行检索,系统还提供了“按姓名排序”的 方式检索视频资源。

作业
? 1、计算机信息检索系统构成要素是什么? ? 2、服务器的功能是什么?

? 3、URL的构成是什么? ? 4、什么是微信息?


相关文章:
第二讲 计算机检索基本原理
第二讲 计算机检索基本原理本章具体内容安排: 本章具体内容安排: 2.1 计算机检索基本原理概述 2.2 计算机检索基本原理 2.3 文献信息数据库的基本概念 2.4 ...
计算机检索基本原理
第二讲 计算机检索基本原理 2.1 计算机检索基本原理概述 2.1.1 计算机检索概念 通过计算机进行的文献信息检索称为计算机检索。 随着计算机技术、 远程通讯技术和...
第二讲 第二章 信息检索原理74.ppt.Convertor
第2章信息检索原理 2.2.1 信息检索的一般原理 无论是手工检索,还计算机检索,各种检索系统的检索原理基本相同。 简单地讲, 就是检索提问标识与存贮在检索工具中...
计算机检索基础
第二讲 计算机检索基础 暂无评价 79页 免费 (第8章)计算机检索基础 暂无评价 ...计算机信息检索基础知识一、 布尔逻辑与检索功能 当人们使用计算机在数据库检索系统...
2011计算机检索报告
7加+第二讲+计算机检索基本... 暂无评价 87页 免费喜欢此文档的还喜欢 计算机信息检索实验报告(6... 63页 1财富值 文献检索报告 3页 免费 信息检索实验报告...
副本工具检索2
副本工具检索2_电脑基础知识_IT/计算机_专业资料。今日推荐 180份文档 2014...29页 免费 网络检索工具(第二讲) 29页 免费喜欢此文档的还喜欢 ...
文献检索综合考试题
第二讲:搜索引擎,检索方法与检索途径,包括逻辑运算符的 使用与如何使用检索词和...text inurl: 大学 intitle: 姚 三:在计算机检索中,常用的逻辑运算符有哪几种...
网络资源与信息检索第二讲作业
百度文库 专业资料 IT/计算机 电脑基础知识百度文库破亿啦 Excel使用技巧大全(超...内蒙古科技大学 第三讲利用中文数据库进行检索 关于机械传动效率 的研究作业 test...
文献检索习题及答案1
4.计算机检索中常用的检索符号有哪些?它们对检索结果有何影响? 5. 文献检索的途径、方法与步骤 第二讲 工具书概述一、名词解释: 1.工具书 2.百科全书 3.字...
信息检索概述
第二讲 信息检索概述 18页 1财富值 信息检索工具与方法概述 3页 2财富值喜欢...许多手工检索工具都有与之对应的计算机检索系统,同时, 一些计算机检索系统也有与...
更多相关标签:
计算机思维导论第二讲 | 计算机信息检索 | 计算机检索 | 计算机信息检索技术 | 计算机检索技术 | 计算机检索论文 | 常用的计算机检索技术 | 计算机文献检索论文 |