相关动态
译技术 | 搜商飞跃:掌握搜索引擎高级语法,信息检索快人一步!
2024-11-10 22:13

译技术 | 搜商飞跃:掌握搜索引擎高级语法,信息检索快人一步!

1. 工具简介

网络科技的迅速发展带来了社会新信息量的剧增,人们的信息资源空前丰富。与此同时,海量信息也使得有效信息的获取成为难点。搜索引擎可以从各种网络资源中浏览和检索需要的信息。随着网络科技和搜索技术的日新月异,搜索引擎已经成为影响人们生活的重要网络应用工具。

以谷歌为例,搜索引擎的工作原理类似,大致可以分为爬虫、索引、搜索、排序四个阶段。所有的搜索引擎都是基于网络爬虫。在爬虫抓取到信息后对这些信息进行提取,分类以及筛选。但是爬虫并不是所有信息都可以获取,它需要遵守robots协议,也就是网站所有者会规定哪些信息是允许爬虫获取,哪些信息是不允许被抓取的。

但是很多人都只会普通的搜索,如果需要更加精准的信息,那么可以考虑使用高级搜索。本文以Google为例向大家介绍主要的搜索引擎语法。

2. 图文教程

2.1 基本搜索

 

1)Google不需要明文使用“+”来表示逻辑与操作,只需要空格就可以了。Google默认的连接符就是AND。这表示如果不加任何修饰符号直接搜索的话,Google就会对所有的关键字进行搜索。

示例:搜索包含关键词“wow”和“gold”的英文网页。

搜索“wow gold”的结果

搜索“wow+gold”的结果

我们可以看到搜索时加不加“+”,搜索结果是完全一样的。

2) 精准搜索:为搜索的关键词打上英文的双引号

在我们明确知道自己要搜索的内容是什么的时候,如果直接搜索,搜索引擎往往会自动把我们要搜索的内容拆分开,甚至会出现一些不相关的内容。

如图所示我们可以看到,直接搜索人工智能,搜索的结果不全是“人工智能算法”,搜索引擎将人工智能和算法两个关键词分开来了,出现了人工智能和算法这两者的搜索结果。此时,如果我们想要精准的人工智能算法的搜索结果,那么我们只需要将人工智能算法打上引号,这样就可以使得检索结果完全匹配搜索内容。要注意,引号必须是英文状态下的引号。下面看一下搜索结果。

从上图我们可以看出,搜索结果中人工智能算法这一整个关键词,没有被分开。这也是在我们日常生活中应用比较广泛的一种方式。

3)排除关键字

在搜索时,使用空格加减号可以拍出不需要的关键字。下面我们以苹果的搜索为例。如果我们想搜索水果苹果,那么在搜索时就去掉手机,电脑和平板三个关键字。搜索结果如下所示。

但是我们从搜索结果中可以看到,并没有完全过滤掉Appl这个电子产品,依然有相关结果出现。广告是非常强大的,无论如何排除关键字,搜索时都会出现苹果公司的广告。

4)OR逻辑搜索

有时候,用户也不知道自己准确的需求,想同时搜索几个关键词,但是又不希望他们互相影响结果,这就需要用户使用大写的OR连接关键词,并用空格隔开进行搜索。下面我们用数据清洗和数据分析的搜索为例:

从搜索结果中就可以看出,页面会同时显示数据清洗和数据分析的结果,两个关键词并不会相互影响。

5)模糊搜索

当你想不起一个完整的搜索内容的时候,直接搜索已知的部分会导致结果不准确,这时候我们可用星号占位来代替想不起来的内容。下面我们用乌克兰*音乐学院为例:

我们可以看到搜索结果都是乌克兰的音乐学院,用户可以从中挑选自己印象中的那个结果。

 

2.2 进阶技巧

 

1)Filetype

在搜索内容后面加上filetype:,然后加上需要检索的文件类型。例如,如果我想搜一本关于人工智能的书的话,我只需要在搜索框内键入:Artificial Intelligence filetype:PDF。下面是搜索结果:

这样就可以找找网络上所有跟人工智能相关的PDF文件,而且能搜出来的内容都可以直接点开下载。对于需要找资料的人来说是一个不错的选择。Filetype的类型也可以是常见的PPT、doc等格式。

2)Site

在搜索内容后面键入site:,然后输入想搜索的网址。Site是利用搜索引擎筛选制定的某个网站的内容。

例如哔哩哔哩和知乎,这些网站都提供了站内搜索的功能,但是很多网站没有站内搜索的功能。因此site这个功能,主要是针对没有站内搜索的网站,或者搜索出的内容不够完善。

例如我需要在教育部的网站搜索研究生相关的内容,那么我们可以利用site功能,在搜索研究生时,在后面加上site:moe.edu.cn。

我们可以看到所有的结果都是教育部网站中关于研究生的内容。需要注意的是不要在冒号后面加空格。

3)inurl和allinurl

在搜索内容后面键入inurl:&allinurl: 然后输入相关URL后缀。

Site是在指定网站搜索,如果我们需要在多个网站搜索,那么我们就可以使用inurl方法了。Inurl就是通过网址URL中的信息来筛选搜索结果。例如如果我们想在中国政府相关的网站中搜索关于民法典的内容,而中国政府相关网站的后缀都是gov.cn。我们可以输入民法典 inurl:gov.cn。下面我们看一下结果:

搜索出来的结果都是各级政府网站中关于民法典的内容。

如果我们想在电影网站搜索一些电影资源,那么可以用inurl: video movie 筛选搜索结果,我们就可以得到网址中包含movie或者film的结果。Allinurl:video movie的搜索结果则比inurl的搜索结果的范围小很多。它表示网址中必须包含movie和film。

4)intitle和allintitle

在搜索内容后面键入intitle:或者allintitle:,然后输入相关标题。

在浏览器进行搜索时,我们可以看到每个标签页都有自己的标题,这个标题也就是所谓的title,每个搜索结果显示的也是和这个页面的title。假如我想搜索Artificial Intelligence intitle:Stanford,结果如下:

我们可以看到搜索结果的标题中包含着Artificial Intelligence和Stanford。

5)define

直接砸搜索引擎中输入define:,然后输入需要查询的名词。

当你需要一个名词的准确定义,又没有词典时,我们就可以用这个方法来进行查询。这样搜索引擎就能给出这个词的定义。下面给出例子:搜索define:Artificial Intelligence

3. 学习心得

 

通过学习Google的高级搜索,获得了许多关于Google的搜索技巧,提高了搜索的精准性,更能获得自己想要的信息。不仅是谷歌,其他搜索引擎也有类似的搜索方法,在日后的学习生活中也要用这样的技巧提高精准度。

4. 配套视频

 

rame class="video_iframe rich_pages" data-vidtype="2" data-mpvid="wxv_2234276875483299845" data-cover="http%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FQZU8VNlRS8KMGibQOz0NfQEqDxQuHwXfu9M2VbbsicEU9icKIHia6ibBdnQFicSXwaGueV6qN4IRF2882UtR2OWTtJVA%2F0%3Fwx_fmt%3Djpeg" allowfullscreen="" frameborder="0" data-ratio="1.6" data-w="1728" style="border-radius: 4px;" data-src="https://mp.weixin.qq.com/mp/readtemplate?t=pages/video_player_tmpl&action=mpvideo&auto=0&vid=wxv_2234276875483299845">rame>

注:学习作品,仅供参考,欢迎指正。

 

作者:石雨

编排:潼潼 四金

审校:小鱼 聪聪 羊羽

    以上就是本篇文章【译技术 | 搜商飞跃:掌握搜索引擎高级语法,信息检索快人一步!】的全部内容了,欢迎阅览 ! 文章地址:http://dgaty.xhstdz.com/quote/68446.html 
     栏目首页      相关文章      动态      同类文章      热门文章      网站地图      返回首页 物流园资讯移动站 http://dgaty.xhstdz.com/mobile/ , 查看更多   
发表评论
0评