当前位置:首页 >> 互联网 >>

搜索引擎


搜索引擎技巧

搜索引擎可分为三种
? 目录式搜索引擎(网站): 雅虎、搜狐、网易 ? 全文式搜索引擎(网页): Google、百度、天网(FTP) ? 元搜索引擎

目录索引搜索引擎的使用
Yahoo! 的创建原理以主题为基础,分类主题目 录是其最大的特点,作为目录型搜索工具的典 范, Yahoo! 在主题分类、目录结构方面具有代 表性。它将网络资源按内容分为 14 个大类,每 个总类下又链接多个小类,逐级链接,最后与 网页、新闻组等相连接。用户可以借助高质量的主

题分类目录,选择自己所需要的主题类目,通过点击超 级链接进入各层,从而找到需要的信息。 “雅虎中国”(http://cn.yahoo.com)提供了一份细蜜、 层次丰富的中文网站分类目录。

全文搜索引擎
? 全文搜索引擎是名副其实的搜索引擎,国外具 代表性的有Google、国内著名的有百度 (Baidu)等。 ? 它们都是通过从互联网上提取的各个网站 的信息,以网页文字为主,搜索出与用户查询 条件相匹配的记录,然后按一定的排列顺序将 结果返回给用户,因此他们是真正的搜索引擎。

元搜索引擎 http://www.widewaysearch.com
?万纬搜索引擎是最有名的中文元搜索引擎。万纬 中文集成搜索引擎包括了5个英文搜索引擎Argos、 Google、hotbot、northernLight、Yahoo和7个中 文搜索引擎如网典、新浪、雅虎(中文)、搜狐、 天网、悠游搜索。用户可根据需要自由选择其中最 多6个引擎进行同步搜索,搜索结果可按相关度、 时间、域名和引擎分类。

学会利用搜索引擎
记得1996年夏季的时候,当我第一次接触Internet, 便被扑面而来的魔力征服了。那种天涯咫尺的感觉,真 是妙不可言。在经历了疯狂的WWW冲浪和如痴如醉的BBS 沉迷之后,我意识到Internet对我影响至深的还是学习 方式的变迁。 如何来描述这种变迁呢? ? 当社会处于初级阶段,,人们靠口传身授、背诵记 忆,尚能从容地进行知识的传授、吸收和应用。这种学 习方式造就了很多“才高八斗,学富五车”的大才子。 但是,随着社会的发展和进步,现在的世界早就不是 “四书五经”的年代了,仅靠“皓首穷经,博闻强记” 一类的古老的方式已无法有效地吸收所需要的知识信息 了。 ? 人们确实非常需要一种在较短的时间内获得较多、较全、 较新的知识或信息的工具。

学会利用搜索引擎
比方说,我们到了大型的图书馆, 往往有一种不知所措的感觉。 目的明确的去学习,即先知道要学

什么,然后有目的的去寻找答案,这 种新的方式看上去才更加有效率。我
们不妨把这称为“即学式”,相应的, 旧的称为“预学式”。

学会利用搜索引擎
不过,“即学式”的实施是有前提的。首先, 要求学习者拥有一个包罗万象的信息库,以供随 时抽取各种目的信息;其次,是需要一个强劲的 信息检索工具,以便高效率的从信息库中提取信 息。很明显, Internet可以充当那个海量的信息库,而 搜索引擎—— 则正是寻找光明之火的绝好工具。“公 欲善其事,必先利其器”。Internet 只有一个, 而搜索引擎则有N 个。不同的搜索引擎,搜索结 果不尽相同。

学会利用搜索引擎
?
老鸟和菜鸟的区别,往往只是在于会不会 利用资源,搜索引擎是很重要的手段。别看很 多老鸟好像从来不提问题,而且还能回答新人 的问题,好像他们什么都懂似的,其实他们并 没那么厉害,只不过完全可以通过自己的搜索 找到答案,所以不需要提问……有搜索高手说, 所谓搜索,就是“在正确的地方使用正确的工 具和正确的方法寻找正确的内容”。

网络资源查询
? 小李正在准备一份介绍海口城市概况 和近几年发展的多媒体材料,打算为 国外来的同行作报告用。小李应该怎 样在网上查找呢? 在没有互联网的时代,面对这样的 一项工作,仅仅资料的收集可能就要 花上好多天的时间。 ? 幸运的是,我们现在有了网络。 ? 但是,您千万别以为有了网络,有了 网络资源搜索工具,一切都会迎刃而 解,万事大吉 !

网络资源查询
原来,小李自以为很简单,他在 Google搜索引擎中使用“海口” 提问关键词进行了检索,结果怎 样呢?返回的结果约有1450000 条,上百万呢! 小李简直不敢相信自己的眼睛。 他想,再试试“Yahoo”吧。他 仍然利用“海口”这一提问关键 词在Yahoo!中进行搜索,结果会 使他满意吗

网络资源查询
? 当然不会啦!小李同样陷入几千个相关网 站和上百万个网页的信息沼泽之中。这时, 小李有点不知所措了,他甚至有点怀疑是 否选错了搜索引擎。

提示:
? 网络资源搜索的第一步不是选择搜索引擎, 而是分析提问内容,从提问内容中提取最能 表达提问主题的若干个关键词,再将这些提 问关键词组合成最适合表达提问内容的提问 表达式。

? 内容----关键词---表达式

网络信息检索
小李可能也意识到返回的结果与他 想得到的结果之间的巨大差距,他 仔细查阅了这些返回的结果,发现 其中含有大量的大学院校、医院等 众多不需要的信息。于是,他利用 这两个搜索引擎提供的布尔逻辑功 能进行检索。

布尔逻辑
在检索中,检索提问涉及的概念往往 不止一个,而是同一个概念涉及多个同 义词或相关词,为了准确表达检索提问, 必须使用逻辑算符将不同的检索词组配 起来。常用布尔检索。

逻辑或

检索式 A OR B 检索式 A + B

? 逻辑“或”是并列概念关系的一种组配,通常 用运算符为“OR”或“+”表示,能够扩大检索 结果,运算结果是阴影部分 ? 例:周恩来OR周总理 ? 少年 or 儿童 ? 至少要有一个出现在记录中

A

B

逻辑与

检索式A AND B A * B

是具有概念交叉关系和限定关系的 一种组配。可缩小检索范围,提高查 准率。 如:①感冒 AND 咳嗽 ②大学生 AND 心理障碍 ③市场经济 AND 诚信(有“市 场经济”同时有“诚信”,运算结果 是阴影部分)。 表明结果必须同时含有A和B才为命中, 指必须出现在同一个记录中。

A A

C B B

逻辑非

检索式A NOT B A - B

? 表达检索词间的排除关系。可缩小检索范围,提 高查准率,运算结果是阴影部分。 ? 例:①学生NOT小学生 ②微量元素 NOT 锌 ③能源 NOT 核能

A

B

布尔逻辑算符
? 查询时用的 () + -* ? ! 均为半角!
含义
? ? ?

逻辑“与”(逻辑“乘”), 表示为 A and B 或 A * B 逻辑“或”(逻辑“加”), 表示为 A or B 或 A + B 逻辑“非”(逻辑 “减”),表示为 A not B 或 A-B 执行顺序为: NOT, AND, OR
但是我们可以根据需要 用括号改变执行顺序。

?

例:政治经济学 and 于光远 政治经济学*于光远 表示检索出来的文献既含“政治经济 学”同时又含“于光远” 的文献。

A

B

A

B
A or B或 A+B
例:政治经济学 or 于光远 政治经济学 + 于光远 表示含有“政治经济学” 、“于光远” 、 “政治经济学”和“于光远” 均为命中文 献。

A and B或 A*B

提示:
搜索引擎在收录内容、检索功能等方面各有千 秋,使用者应仔细阅读系统帮助文件,根据 自己的特定检索需求合理地选择搜索引擎。 ? 命令式检索 使用特定的操作命令来实施检索,一般每个 系统都有自己特定的指令系统。 每个搜索引擎提供的检索功能和检索特性是 不一样的,同一种检索功能在每个搜索引擎中表 达方式和使用方法也是不尽相同的。(确切地知 晓每一种搜索引擎的检索功能与特性,无需死记 硬背。只要在使用时,查看帮助信息便是了)。

检索语法
? ? ? ? ? ? 小李立即在Google 、Yahoo中分别用: 海口 -大学 -医院 海口 NOT大学 NOT医院 果不出所料,返回的记录已减少了很多! 然而,Google仍然有46300项之多,。 怎么办呢?

检索语法
?
? 看来仅仅依靠逻辑“非”功能是远远不能达 到预期目标的,小李不得不调整检索关键词。 经过仔细分析,他觉得向国外公司的同 行介绍的内容应该为海口的一般性的介绍,使 用“海口”和“概况”这两个关键词也许更切 合提问主题。 赶紧试试看! 小李立即在Goggled中输入: 海口 概况 结果怎么样呢?

? ? ?

????

提示:
在分析提问内容时,需细化提问内容的主题, 提取多个符合提问内容的关键词,这样,可以 获得较有效的检索结果。小李第一次搜索失败 的原因正是在于使用了“海口"这样一个太宽 泛的提问关键词。

什么是关键词?
? 关键词,就是您输入搜索框中的文字,也就是 您命令搜索引擎寻找的东西。 您可以命令搜索引擎寻找任何内容,所 以关键词的内容可以是:人名、网站、新闻、 小说、软件、游戏、星座、工作、购物、论 文?? 而那些对文献主题无实质意义的词汇,如 冠词、介词、连词、某些副词以及某些形容词 均不能做关键词。(禁用词表)

关键词法一般不编关键词表,而 是相反,编制“非关键词表”或 称禁用词,如:
? a ? ? ? in an is as of at on but that by this from was had which he you her &

?
?

are
it

be
or

for
to

have
with

his

关键词的选择技巧
? 我们了解常规搜索方式,但每个人都会搜索出 不同结果,为什么?核心问题在于关键词选择 不同。 ? 在当今互联网上,你永远不会愁你找不到东西, 而是东西太多,你无法找到你需要的东西,因 此搜索效率便成为最重要的一环,搜索效率直 接关系到搜索的关键词的选择。

中文分词
? 中文搜索引擎,跟英文搜索引擎最大的区别是分词。因 为英文的单词与单词之间是天然分隔的,而中文是按句 写的,字与字之间是没有间隔的。

例如:跳迪斯科
? “跳” “迪” “斯” “科”

?

“跳”

“迪斯科”

谁说牛奶不如果汁好喝
理解了搜索引擎的分词,了解 了用“眼镜”很可能搜索不到 “眼镜蛇”,用“海参”很可 能搜索不到“海参崴”,用 “异性”很可能搜不到“相异 性”,搜索者就可以更有效地 选择关键词了。

关键词的分析必须保证三点 一是注意专业性:
? 不使用过于通俗简单的词语,比如,你想查找 有关降雨量方面的信息,虽然它属于天气方面 的,但如果你输入的是“天气”,就会返回大 量与天气有关的信息,而结果中充斥大量无关 的信息,但如你直接输入“降雨量”,就会获 得比较满意的结果。

二是具有代表性:
要注意一词多意的问题,很多词具有一词 多意的特性。比如,笔记本,可以指用来手写 的本子,现在也作为笔记本电脑的简称。遇到 这类词,可能需要在搜索框中输入尽量减少歧 义的词语,比如改输入笔记本电脑。

三注意使用“同义词”
? 往往同一件事情或事物,不同作者喜欢用不同 的词来表达,这就造成了庞大的同义词,如果 偏偏你头脑中的“同义词”不是那么全,造成 漏检就不足为怪了。例:

? 艾滋病——艾滋病、爱滋病 ? 碳纤维——碳纤维、炭纤维

提示
大多数的搜索引擎都是采用相 关度来对检索结果进行排序的, 最终结果都是与提问关键词相关 程序最大的命中记录排在前。所 以,仔细查阅前10-20个记录, 可以基本满足需求。

1、分析检索课题、选择概念表达词
(1)注意选择同义词和相关词
《跨国公司经营管理研究》 ? 跨国公司的同义词有: ? 跨国企业 ? 跨国经营 ? 国际化经营等

《论中国特色的社会保障制度》
? 社会保障的相关词是: ? 社会保险 ? 社会救助 ? 社会福利等

(2)注意适当控制检索词的内涵与外延

例: 《跨国公司经营管理研究》 如以跨国公司和经营管理作为检索词, 将会漏掉一些文章,因为有些文献题名对 跨国公司经营管理的表述并没有“经营管 理”一词。像 跨国公司的营销管理、 跨国公司的质量管理、 跨国公司的财务管理、 跨国公司的不动产管理、 跨国公司的流动资产管理等等, 所以“管理”一词,则可保证最大限度的 查全率。

字段限定检索技术(field limit) 限定检索:为了提高检索的查准率,缩小 检索的范围 ,将检索词限定在特定的字段 中进行检索。限定字段通常包括:
– – – – – – – – – – – – – 题名 作者 机构 关键词 主题词 分类号 出版社 出处(刊名、卷期) 文摘 URL 主机 域名 Usenet新闻组

常 用 检 索 字 段 符

? ? ? ? ? ? ? ? ? ?

TI---篇名 AB---文摘 SH---主题词 AU---著者 Cs---著者单位 DT---文献类型 JN---期刊名 LA---语种 PY---年份 CC---分类号 KW---关键词

逻辑算符的组合使用方法 (构造检索提问式是计算机信息检索的关键)
如检索题“跨国公司经营管理研究”: 提问式1:(跨国公司+跨国企业+跨国经营) × 管理 = 检索结果90篇 提问式2:(跨国公司+跨国企业+跨国经营)×管理 ×(1997+1996)= 检索结果35篇

题“论中国特色的社会保障制度”:
? 提问式1:(社会保障制度+社会保险制度)×(我国 +中国)×(PY=1997+PY=1996)= 检索结果99篇 提问式2:(社会保障制度+社会保险制度+ 养老保险 +医疗保险+失业保障)×(我国+中国)× (PY=1997+PY=1996)×G=中国=检索结果160篇 扩展检索的方法: 概念的扩大;范围的扩大;增加同义词;年代的扩 大。 例如:检索与“汽车营销”相关的信息 提问式1:汽车营销 提问式2:汽车营销 + 汽车构造 + 汽车保险 + 汽车修 复 + 汽车美容 + 汽车整形 + 汽车理赔

?

? ?

使用搜索引擎常见错误:
? 经常有网友抱怨搜索引擎实在太烂,什么东西都找 不到。其实并不是搜索引擎有问题,而是你的使用方 法有待商妥。 ? 常见错误1—— 输入错别字 ? 当你感觉某种内容网上应该有很多相关内容,但 搜索到的确是寥寥无几的几个时,这时你就应该看看 是不是输入的关键词有错别字了。 ? 如想找“星际争霸”的相关内容,而你输入了“星际 争吧”、“星及争霸”、“星际争罢”等,还有“刘得 华”、“以德制国”之类的,这样的关键词就会搜索 不到有用的资料。

常见错误2——
滥用多义词 如我们搜索“Java”,搜索引擎
是不能象我们一样理解多义词的,搜索到的结果既是 太平洋上的一个岛、又是一种著名的咖啡、还是一种 计算机语言,这样得到的搜索结果就很杂乱。如果我 们用多个关键词或其他词语代替多义词作为搜索关键 词,像用 “爪哇 印尼” “爪哇 咖啡” “Java 语言”分别来搜索我们不同 的需要,这样就会得到比较满意的结果。

常见错误3——
? 不拆分关键词 ? 如我们输入“广州到北京的列车时间表”、“广 州日报在广州的发行情况”、“刘德华今年多大 了”等,使用这些关键字就好比你把搜索引擎当 成了一个服务员问话一样,搜索引擎只是机械, 它只会把含有这个关键词的网页找出来,根本不 管你网页上的内容是什么。 ? ? ? ? 如果我们使用: “广州 北京 列车 时刻表”、 “广州日报 发行” 这样去搜索就会好的多。

常见错误4:

滥用搜索引擎
? 一般的搜索引擎对动态内容,如:论坛和数据库内 容的网页检索能力较弱,所以这类信息也不适合用 一般的搜索引擎搜索,而是应该去专用网站寻找。 ? 搜索引擎并不是万能的,有时候我们需要查找的资 料找不到原因是:搜索引擎从抓取网页、解析、索 引到提供检索是有一定周期的,信息滞后的周期从 一周到一月不等。如每四年一次奥运会,大家最关 心的是随时知道中国获得了几块金牌,这时专业的 新闻网站才是你的正确选择。

窍门1

检索策略的优化:细化

? 即缩小检索范围 – 主题细化,或者用主题词表、索引词表选择 更专指的主题词或关键词 – 通过浏览结果选择更专指的词 – 运用算符and,not等限制或排除 – 指定字段检索 – 从年代和地理及语言、文献类型上限制

窍门2

检索策略的优化:扩展

? 对已确定的检索词进行其同义词、同义的相关 词、缩写和全称检索,保证文献的检全率,防 止漏检 ? 利用系统的助检手段和功能,有的系统提供树 形词表浏览, 使我们可以用规范词、相关词、 更广义的上位词进行扩展。 ? 利用论文所征引的参考文献,当找到和课题相 关的论文时,可参考其所征引的参考文献。 ? 使用运算符OR或截词符“*”、“?”等进行 扩展检索

窍门3

学会强制搜索: “”
用句子做关键词,必须加英文引号(注意:不使用 过长的词组或短语)。 例1:搜索《再别康桥》英文译稿 关键词要用“再别康桥+Cambridge”(康桥的英文 单词)。 注意:本例中的关键词用“再别+Cambridge”,这也 是查找英文译稿或其他翻译文章的重要方法。 例2:给关键词加””(要是半角的哦),可以进行 不分散型查询。如“伊拉克战争爆发”,在查询到的 文档中将作为一个整体出现。

调整检索策略
? 什么是“检索策略”,就是全盘计划与方案,检 索词可以是: ? ①单一词汇(简单检索),例如:电子商务、图书 馆、mp3等。会寻找合适的检索词并分解到最小的 检索点。 ? ②一个以上的词汇(词组检索),会用布尔逻辑或 其他策略将他们结合起来。 ? ③一句完整的话(语句检索),如,目前全台湾上 网人口有多少?1976年历史上发生了什么事?你 就应该?

? 缩小检索范围, ? 提高查准率的方法:
? 1、使用and 、not等 限制检索范围; ? 2、减少同义词与相关 词; ? 3、选择检索范围较小 的字段 ? 4、使用二次检索; ? 5、使用下位词; ? 6、使用精确检索,如 对于固定短语来说可用 英文“”引起来。

? 扩大检索范围, ? 提高查全率的方法:
? 1、选用同义词或近义词、 相关词 ,使用布尔逻辑 符or连接; ? 2、减少逻辑“与”的使 用,丢掉一些太专指的 概念; ? 3、选择较大检索范围的 字段如摘要; ? 4、使用截词符; ? 5、使用上位词(如飞行 器?航天飞机?载人航 天飞机)。

检索实例主题1:
第二次世界大战中的美国政治和军事领导人 检索步骤(分析主题逻辑关系): 1)、 政治领导人 或 军事领导人

2)、(政治领导人 或 军事领导人)和 美国
3)、(政治领导人 或 军事领导人)和 美国 和 第二次世界大战

网上信息检索实例2
? 查询某地区电子企业的财务信息

– a:未知IP地址,利用搜索引擎Yahoo,输入 http://www.Yahoo.Com – b:选择electronics(电子行业) – c:输入Financial(财政的) – d:选择地区、确定企业名称 – e:输入企业网址,进入主页,检索信息。

检索汽车价格信息3
? a:借助行业机构网络进行检索 ? (通过中国汽车行业经济技术网 http://www.Chinaauto.ac), 查询市场行情 价格信息; ? B:利用 “行业协会”、学科信息门户, 进相关网站,查市场行情,价格信息。

信息检索策略
网络信息检索是一种新型的检索手段和模式, 必须遵循一定的检索步骤和运用有关的检索策 略与技巧。 检索策略与技巧:采用广度优先检索方法; 优先考虑权威机构提供的专题信息;善于使用在 线帮助;设法提高查准率、查全率和提高上网速 度等。

网上学术信息检索流程


相关文章:
搜索引擎教程_图文.ppt
搜索引擎教程 - 搜索引擎 提纲 ?搜索引擎的发展简史 ?搜索引擎的分类 ?使用搜索引擎 ?搜索引擎的基本原理 ?第一次上机总结 ?搜索经济 ?搜索引擎的未来发展趋势 ...
浅谈对于搜索引擎的认识.doc
浅谈对于搜索引擎的认识 - 浅谈对于搜索引擎的认识 通过近期我对网络传播课程的学习,我认识并学习到一个科技名词搜索引擎。初 次接触很难理解它是什么,能干...
30个搜索引擎指令,您知道几个?.doc
30个搜索引擎指令,您知道几个? - 作为一名SEOer,我们不但要学SEO的技巧,还要懂得使用一些搜引擎的搜索指令,这些搜索指令普通的用户几乎用不到,但对SEOer用来研究...
搜索引擎的概念.doc
搜索引擎的概念 - 搜索引擎的概念: 运用特定的计算机程序 搜索引擎的概念: 搜索引擎(search engine)是指根据一定的策略、 从互联网上搜集信息,在对信息进行组织和...
百度谷歌和搜狐搜索引擎的特点比较.doc
百度谷歌和搜狐搜索引擎的特点比较 - 百度,谷歌,搜狐搜索引擎特点比较 相同点:
搜索引擎工作原理简介_图文.doc
搜索引擎工作原理简介 - 搜索引擎工作原理简介 一、 搜索引擎的工作过程大体分为三个阶段 1. 2. 搜索引擎用来爬行和访问页面的程序称为蜘蛛 spider, 也称机 器...
搜索引擎练习及水平测试题.doc
搜索引擎练习及水平测试题 - 搜索引擎按其工作方式主要可分为三种, 分别是全文搜索引擎 (Full Text Search Engine )、目录索引类搜索引擎( Searc...
搜索引擎分类及工作原理.doc
搜索引擎分类及工作原理 - 获得网站网页资料,能够建立数据库并提供查询的系统---搜索引擎
搜索引擎_图文.ppt
搜索引擎_互联网_IT/计算机_专业资料。第十章 搜索引擎 主讲人:刘进军 湘潭
比较各种搜索方法与技巧.doc
如何快速、正确的寻找到我们所 需的资源也需要一定的方法和技巧, 关于搜索引擎的使用方法有多种 多样,搜索引擎检索信息主要有目录检索和关键词查询两种方法。 目录...
各国常用的搜索引擎整理.doc
各国常用的搜索引擎整理 - 此文档利于我们通过各国家本地搜索引擎直接查找我们需要的老外 客户的信息,助我们找到更多海外客户。 除谷歌搜索引擎之外的,小语种搜索引擎...
搜索引擎符号的使用.doc
搜索引擎符号的使用 - 对于搜索中文内容,百度,腾讯等中国人创造的搜索引擎搜索出
搜索引擎高级技巧.doc
搜索引擎高级技巧 - 百度网页搜索特色 百度快照 衡转换 相关搜索 拼音提示 错
几种常见的搜索引擎的性能比较与分析2.doc
几种常见的搜索引擎的性能比较与分析2 - 闽江学院 本科毕业论文 题 目几种常见的搜索引擎性能比较与分析 吴宽富 120081003154 物理系与电子信息工程系 2008 级 ...
搜索引擎中常用的逻辑关系语法是AND、OR、NOT.doc
搜索引擎中常用的逻辑关系语法是AND、OR、NOT_互联网_IT/计算机_专业资料。搜索引擎中常用的逻辑关系语法是 AND、OR、NOT 搜索引擎中常用的逻辑关系语法是: AND、...
搜索引擎测试.doc
搜索引擎测试 - 1. 功能测试 对搜索引擎本身的功能测试 搜索引擎本身的功能测试,主要就是按照用例,通过不同的搜索关键字、属 性的组合(按照搜索引擎的规则)来...
搜索引擎命令大全.doc
搜索引擎命令大全 - 搜索引擎命令大全 -seoerboy 分享-觉得好就收藏
世界各国搜索引擎统计.xls
世界各国搜索引擎统计 - 世界各地搜索引擎统计 美国(英语) 引擎网址 www.
搜索引擎中运算符的使用技巧.doc
搜索引擎中运算符的使用技巧 - 搜索引擎中运算符的使用技巧 折叠 1、简单查询 在搜索引擎中输入关键词,然后点击“搜索”就行了,系统很快会返回查询结果,这是最...
各国搜索引擎.doc
各国搜索引擎_互联网_IT/计算机_专业资料。立陶宛本地搜索引擎 1、http:
更多相关标签: