1、什么是搜索引擎
搜索引擎是一个为用户提供信息“检索”服务的网站,它使用某些程序把因特网上的所有信息归类以帮助人们在茫茫网海中搜寻到所需要的信息。
2.搜索引擎技术原理
a、发现并搜集网页信息;
b、对收集到的信息根据一定的规则进行提取并建立索引库;
c、用户检索利用。
3、常用搜索引擎
http://www.baidu.com (百度)
http://www.google.cn (谷歌),可以借助其他谷粉之类的,过于厉害的都是要被禁的。
http://www.yahoo.com.cn (雅虎)
http://www.sogou.com (sohu)
http://iask.com (sina,检索词与运算符号之间可以不加空格)
http://www.youdao.com(网易,布尔逻辑算符与检索词需空格)
http://www.zhongsou.com (中搜,北极星)
360搜索。
不推荐bing,搜索效果经常不理想。其他的大家可在评论补充。
另外还有各式各样的搜索,比如钟馗之眼(就是神器)
4、搜索技巧。
使用双引号(“”)进行精确查找
搜索引擎大多数会默认对检索词进行拆词搜索,并会返回大量无关信息。解决方法是将检索词用双引号括起来,(使用英文输入状态下的双引号。有些搜索引擎对双引号不进行区分),这样得到的结果最少,最精确。
使用多词检索(空格检索)
要获得更精确的检索结果的简单方法就是添加尽可能多的检索词,检索词之间用一个空格隔开。例如:想了解有些被上的站点的相关信息,在搜索框中输入“admin hack by login”会获得理想的检索结果。这里的空格的作用相当于布尔逻辑“与”的作用。
使用“-”去掉无关资料
如果要避免搜索某个词语,可以在这个词前面加上一个减号(“-”, 英文字符)。在减号之前必须留一空格,但“-”和检索词之间不能留空格。
使用OR包含多个关键字中的任意一个
大写的“OR”表示逻辑“或”。搜索“AORB”,搜索结果中要么有A,要么有B,或者A、B同时都有。
示例:搜索如下网页,要求必须含有“admin”和“login”,没有“hack by”,可以含有以下关键字中人任何一个或者多个:“admin”、“蜘蛛”、“webshell”、“login”。
搜索:“adminOR蜘蛛ORbackdoorORlogin”
在指定网站内搜索(使用site语法)
格式为:检索词+空格+site:网址。
例如:admin site:aaa.com。
admin login site:aaa.com | aaa.com.cn
注意:site:和站点名之间不要带空格
指定文档类型搜索
表达式为:查询词+空格+Filetype:格式。
文档格式可以是DOC、PDF、PPT、XLS 、 ALL (全部文档)等类型。大小写一样。
例如:filetype:doc Python编程 (正着反着都一样)
语法中的冒号中英文皆可,但检索词和filetype之间一定要加一个空格。
在部分搜索引擎中,如百度,filetype语法可以与site语法混用。例如在百度和谷歌搜索关于Python编程的文档,就可以用:site:www.baidu.com | www.google.com filetype:all Python编程
限定在标题中搜索( TITLE: or INTITLE: )
“TITLE:和“INTITLE:”都用于针对标题进行搜索。
格式: TITLE: (INTITLE:)检索词
例如:TITLE:51cto
把搜索范围限定在url链接中
格式:inurl:检索词
例如:51cto inurl:麦林泡泡,它表示“51cto” 是可以出现在网页的任何位置,而“麦林泡泡”则必须出现在网页url中。百度、Google等都支持该语法。(URL 是Uniform Resource Locator的缩写)
注意,inurl:语法和后面所跟的检索词间不要有空格。
使用“《》”进行精确查找:碉堡了,我也没看懂这个到底咋回事
例如,使用检索式“《51cto》”,可以精确查找到《51cto》这本书的相关信息,而不是51cto信息;而使用《Python编程》进行检索得到的结果则多为《Python编程》这本书的信息。
使用加号(+)
在关键词的前面使用加号,也就等于告诉搜索引擎该单词必须出在搜索结果的网页上。例如:在搜索引擎中输入“admin+login+php”,表示要查找的内容必须同时包含“admin、login、php”三个关键司。
使用通配符(*和?)
“*”表示匹配的字符数量不受限制,“?”只能匹配一个字符。
例如:输入“computer*”,则可以找到“computer、computers、computerized”等,而输入“comp?ter”,则只能找到“computer、compater、competer”等单词。
提高搜索精准度
["51cto"] 就比 [51cto] 更确切。 虽然只要搜51cto基本都是我们51cto的站。
我们也可以尝试在中文站点搜索英文关键词。因为有的翻译或者英文内容更新鲜。链接打不开直接上快照。
Site语法的使用
语法格式:
site : 网址 关键词
或者 关键词 site : 网址
用途:
Google的“site:”功能比多数网站自己的站内检索还要好用,如果你查的不是动态数据库,而且对时效性要求不高的话。
5、其他功能
6、需要特别注意的:
我看到在我们论坛中关于安全的版块也有写关于谷歌hack的技术。
我也是看过一篇相关的。但是有些内容并没有实际操作。
http://huaidan.org/archives/406.html
最后,我并不是什么技术比较硬的人,我只是把别人的技术整理成了笔记,然后想办法用的更流畅。
也是十分感谢那些分享技术的前辈。你们的贡献我们铭记。