陳德深

我在華農當二進制民工之旅

谷歌、百度等搜索引擎高级搜索语法

搜索引擎是我们平时上网用到的最多的工具栏吧,遇到什么不会的问题,都习惯百度一下。善用搜索引擎可以解决你几乎所有的问题,只有想不到,没有你搜不到,当然这个搜也是有方法的。

常用的搜索引擎也就这么几家,谷歌,百度两巨头,国内的还有搜搜,搜狗,狗狗等等,微软的Bing,雅虎(现在没了),就我个人来讲,我不是什么高端用户,百度还是我用的最多的,谷歌也用,只是百度不到我要的结果时用一下,现在因为墙的问题,谷歌也是老出问题,还是百度适用国内的环境。

上面说到想要更精确的答案就要利用一定的搜索技巧,这里的技巧就是用到高级语法,每一个搜索引擎一般都会有其独到的语法,但是语法大部分也是通用的。下面就介绍一下各个搜索引擎的搜索高级语法。

一、 Google谷歌搜索高级语法

1. 减除无关资料 (-)

如果要避免搜索某个词语,可以在这个词前面加上一个减号(“-”, 英文字符)。但在减号之前必须留一个空格。

2. 英文短语搜索 (””)

在 Google 中,可以通过添加英文双引号来搜索短语。双引号中的词语(比如"like this")在查询到的文档中将作为一个整体出现。这一方法在查找名言警句或专有名词时显得格外有用。

一些字符可以作为短语连接符。Google 将“-”、“\”、“.”、“=”和“..."等标点符号识别为短语连接符。

3. 指定网域

有一些词后面加上冒号对 Google 有特殊的含义。其中有一个词是“site:”。要在某个特定的域或站点中进行搜索,可以在 Google 搜索框中输入“site:xxxxx.com”。

例如,要在 新浪 站点上查找新闻,可以输入:新闻 site:www.sina.com.cn

4. 查找特定文件

Google已经可以支持13种非HTML文件的搜索——PDF文件,Microsoft Office (doc, ppt, xls, rtf) 、Shockwave Flash (swf)、PostScript (ps)和其它类型文档。新的文档类型只要与用户的搜索相关,就会自动显示在搜索结果中。

例如,如果您只想查找 PDF或Flash 文件,而不要一般网页,只需搜索“关键词 filetype:pdf” 或“关键词 filetype:swf”就可以了。

5. 按链接搜索

例如,“link:www.google.com”将找出所有指向 Google 主页的网页。不能将 link: 搜索与普通关键词搜索结合使用。

6. 限定关键词只在标题中

例如“allintitle:微软 苹果”表示“微软”和“苹果”都必须出现在标题中

“intitle:微软 苹果”表示“微软”必须出现在标题中,“苹果”可以出现在网页的任意位置,可以是标题也可以不是。

7. 限定关键词只在URL中

例如“allinURL:koko com”表示“koko”和“com”都必须出现在URL中

“inURL:koko com”表示“koko”必须出现在URL中,“com”可以出现在网页的任意位置,可以是URL也可以不是。。

8. Info用来显示与某链接相关的一系列搜索

提供cache、link、related和完全包含该链接的网页的功能。

9. Related用来搜索结构内容方面相似的网页

例:搜索所有与中文新浪网主页相似的页面(如网易首页,搜狐首页,中华网首页等),“related:www.sina.com.cn”。.

10. Cache用来搜索GOOGLE服务器上某页面的缓存

这个功能同“网页快照”,通常用于查找某些已经被删除的死链接网页,相当于使用普通搜索结果页面中的“网页快照”功能。

二、 百度(baidu)搜索高级语法

1. 把搜索范围限定在网页标题中——intitle

网页标题通常是对网页内容提纲挈领式的归纳。把查询内容范围限定在网页标题中,有时能获得良好的效果。使用的方式,是把查询内容中,特别关键的部分,用“intitle:”领起来。

例如,找林志玲的写真,就可以这样查询:写真 intitle:林志玲

注意,intitle:和后面的关键词之间,不要有空格。

2. 把搜索范围限定在特定站点中——site

有时候,您如果知道某个站点中有自己需要找的东西,就可以把搜索范围限定在这个站点中,提高查询效率。使用的方式,是在查询内容的后面,加上“site:站点域名”。

例如,天空网下载软件不错,就可以这样查询:msn site:skycn.com

注意,“site:”后面跟的站点域名,不要带“http://”;另外,site:和站点名之间,不要带空格。

3. 把搜索范围限定在url链接中——inurl

网页url中的某些信息,常常有某种有价值的含义。于是,您如果对搜索结果的url做某种限定,就可以获得良好的效果。实现的方式,是用“inurl:”,后跟需要在url中出现的关键词。

例如,找关于photoshop的使用技巧,可以这样查询:photoshop inurl:jiqiao

上面这个查询串中的“photoshop”,是可以出现在网页的任何位置,而 “jiqiao”则必须出现在网页url中。

注意,inurl:语法和后面所跟的关键词,不要有空格。

4. 精确匹配——双引号和书名号

如果输入的查询词很长,百度在经过分析后,给出的搜索结果中的查询词,可能是拆分的。如果您对这种情况不满意,可以尝试让百度不拆分查询词。给查询词加上双引号,就可以达到这种效果。

例如,搜索 上海科技大学 ,如果不加双引号,搜索结果被拆分,效果不是很好,但加上双引号后,“上海科技大学”,获得的结果就全是符合要求的了。

书名号是百度独有的一个特殊查询语法。在其他搜索引擎中,书名号会被忽略,而在百度,中文书名号是可被查询的。加上书名号的查询词,有两层特殊功能,一是书名号会出现在搜索结果中;二是被书名号扩起来的内容,不会被拆分。 书名号在某些情况下特别有效果,例如,查名字很通俗和常用的那些电影或者小说。比如,查电影“手机”,如果不加书名号,很多情况下出来的是通讯工具—— 手机,而加上书名号后,《手机》结果就都是关于电影方面的了。

5. 要求搜索结果中不含特定查询词

如果您发现搜索结果中,有某一类网页是您不希望看见的,而且,这些网页都包含特定的关键词,那么用减号语法,就可以去除所有这些含有特定关键词的网页。

例如,搜 神雕侠侣,希望是关于武侠小说方面的内容,却发现很多关于电视剧方面的网页。那么就可以这样查询:神雕侠侣 -电视剧

注意,前一个关键词,和减号之间必须有空格,否则,减号会被当成连字符处理,而失去减号语法功能。减号和后一个关键词之间,有无空格均可。

6. 专业文档搜索

很多有价值的资料,在互联网上并非是普通的网页,而是以Word、PowerPoint、 PDF等格式存在。百度支持对Office文档(包括Word、Excel、Powerpoint)、Adobe PDF文档、RTF文档进行了全文搜索。要搜索这类文档,很简单,在普通的查询词后面,加一个“filetype:”文档类型限定。 “Filetype:”后可以跟以下文件格式:DOC、XLS、PPT、PDF、RTF、ALL。其中,ALL表示搜索所有这些文件类型。例如,查找张五常关于交易费用方面的经济学论文。“交易费用 张五常 filetype:doc”,点击结果标题,直接下载该文档,也可以点击标题后的“HTML版”快速查看该文档的网页格式内容。

您也可以通过 百度文档搜索 界面( http://file.baidu.com) ,直接使用专业文档搜索功能。

三、Yahoo雅虎搜索高级语法(可以忽略)

1. title:

“title:”用于针对标题进行搜索。

例如:搜索title:张学友,搜索引擎会搜索到所有标题中包含“张学友”的网页。由于网页的标题通常会准确的描述网页的内容,所以使用“title:”进行搜索的效果可能更精确。

title的释义:超文本窗口标题的开始和结束,它被显示在浏览器顶端的标题栏中。

2. Link:

“Link:”用于查找所有链接到某个网址的网页。

例如:

1、搜索link: http://www.yahoo.com.cn /,会搜索到所有链接到“www.yahoo.com.cn”的网页;

2、搜索姚明 link: http://www.yahoo.com.cn/ 或者link: http://www.yahoo.com.cn/ 姚明,会搜索到所有链接到“www.yahoo.com.cn”的网页中,包含“姚明”一词的网页。

备注:搜索时域名前面不能缺少“http://”, 后面不能缺少“/”。

3. Site:或者 domain:

“Site:”或者“domain:”用于限定搜索结果的来源。

您如果知道某个站点中有自己需要找的内容,就可以把搜索范围限定在这个站点中,提高查询效率。使用的方式,是在查询内容的后面,加上“site:站点域名”。

例如:

想查询雅虎网站中报导的姚明信息,可以有以下两种方法:

1、在搜索框中输入姚明 site:yahoo.com.cn 或者姚明 domain: yahoo.com.cn,(注意中间使用空格隔开)。搜索引擎会搜索到在域名“www.yahoo.com.cn”及其子域名中的所有包含“姚明”一词的网页。

2、在搜索框中输入site: 姚明yahoo.com.cn也可以得到相同的搜索结果。

备注:“site:”后面跟的站点域名,不要带“http://”;另外,“site:”和站点名之间,不要加空格。

4. Hostname:

“hostname:”的用法与“site:”、“domain:”相同,只不过使用 “hostname:”时搜索到的结果是在当前域名下的网页,而不包括其子域名中的网页。

5. url:

“url:”用于精确搜索url。

例如:搜索 url: http://cn.yahoo.com,搜索引擎只会搜索到一个结果——雅虎中国。

6. 如何使搜索结果中的查询词不被拆开?

当您输入较长的查询词时,雅虎搜索引擎会依据查询词的字符串做拆字处理。若您需要得到精确、不拆字的搜索结果,可在查询词前后加上双引号(中文双引号、英文双引号都可以)。

例如: 当您输入北京大学考研时,系统会将查询词自动拆成“北京大学”、“考研”等字符串;如果您输入“北京大学考研”,搜索结果将精确匹配“北京大学考研”。

备注:在精确匹配搜索的情况下,搜索结果数会比较少。

四、Sogou搜狗搜索高级语法

1. 使用双引号进行精确查找

例如:在搜索框中输入“"电脑技术“,这时只反馈回网页中有“电脑技术”这几个关键字的网页,而不会返回包括“电脑”和“技术”的网页,这会比输入电脑技术得到更少、更好的结果。

这里的双引号可以是全角的中文双引号“”,也可以是半角的英文双引号""。而且可以混合使用,例如: “电脑技术" , "电脑技术“搜狗都是可以智能识别的。

2. 使用多个词语搜索

由于搜狗只搜索包含全部查询内容的网页,所以缩小搜索范围的简单方法就是添加搜索词。 添加词语后,查询结果的范围就会比原来的“过于宽泛”的查询小得多。输入多个词语搜索(不同字词之间用一个空格隔开),可以获得更精确的搜索结果。

例如:想了解北京动物园的相关信息,在搜索框中输入 “ 北京 动物园” 获得的搜索效果会比输入 “动物园” 得到的结果更好。

3. 减除无关资料

如果要避免搜索某个词语,可以在这个词前面加上一个减号(“-”, 英文字符)。但在减号之前必须留一空格。Sogou查询非常简洁方便,只需输入查询内容并敲一下回车键 (Enter),或单击“搜狗搜索”按钮即可得到最相关的资料。

4. 在指定网站内搜索

如果想知道某个站点中是否有自己需要找的东西,可以把搜索范围限定在这个站点中,提高查询效率。在想要搜索指定网站时,使用site语法,其格式为:查询词+空格+site:网址。例如,只想看搜狐网站上的世界杯内容,就可以这样查询: 世界杯 site:sohu.com 。搜狗也支持多站点查询,多个站点用"|"隔开,如: 世界杯 site:www.sina.com.cn|www.sohu.com (site:和站点名之间,不要带空格。 )

除了基本站内查询外,搜狗还为站长和网站管理员们提供了更加强大的功能,使用的时候不加关键词,只需要输入“site:站点域名”,就可以查找你的网站在搜狗的收录量。提供的功能包括:

收录查询:输入“site:网站域名”,可以查到站点在sogou的收录情况,如果博客地址,就可以知道你的博客在搜狗的收录情况,比如:17173 Good Feel MC的共享空间

域名后缀:你可以查看一个域名或者子域名下的内容,结果按照重要性排序。比如 “site:cn”是指在所有网站域名最后为cn的收录情况,您可以试着查询一下这些网站:国内公司 政府机关 教育机构

支持https:所有以https:// 开头的网站链接也都能使用站内查询查找,比如: 招商银行一网通主站

端口查询:大部分网站使用80端口,不需要特别指定,但有些开在其他端口,这个时候使用 “site:站点域名:端口号”进行查询即可。

海量数据支持:搜狗的站内查询内容丰富,针对您的查询站点,提供全面的数据

5. 文档搜索

在互联网上有许多非常有价值的文档,例如DOC、PDF等,这些文档质量都比较高、相关性强,并且垃圾少。所以在查找信息时不妨用文档搜索。其搜索语法为:查询词+空格+Filetype:格式,格式可以是DOC、PDF、RTF、ALL(全部文档)(搜狗即将支持PPT、XLS格式)。例如:市场分析 filetype:doc,其中的冒号是中英文符号皆可,并且不区分大小写。filetype:doc可以在前也可以在后,但注意关键词和 filetype之间一定要有个空格。例如:filetype:doc 市场分析。

filetype语法也可以与site语法混用,以实现在指定网站内的文档搜索。例如在中国农业大学和清华大学网站内搜索有关“中国”的文档,就可以用:site:www.cau.edu.cn|www.tsinghua.edu.cn filetype:all 中国

五、四大搜索引擎高级语法总结

当然有些语法可能随着搜索引擎的不断更新而变更或取消。

熟练的利用这些高级语法,可以节约大量的时间,更有效率的找到自己想要找的东西。

posted on 2012-04-18 17:02 陳德深 阅读(1408) 评论(0)  编辑 收藏 引用


只有注册用户登录后才能发表评论。
网站导航: 博客园   IT新闻   BlogJava   知识库   博问   管理