深入了解搜索引擎原理(二)

http://www.itjxue.com  2015-08-02 11:07  来源:未知  点击次数: 

  上一节maoseomao主要讲解了google搜索引擎更新爬虫,和深度爬虫。

  更新爬虫:Google搜索引擎可以同时派出N个爬虫,同时访问互联网,如果发现新的信息就会放到自己所带的数据库中,我们把这种爬虫称之为“更新爬虫”。更新爬虫能够根据互联网上的URL地址,不停的以“光速”爬行,一旦自己所带的数据库装不下更多的信息时,它们会返回谷歌所提供的单独数据库,把自己所带的信息放在里面,然后又出来接着收集信息。

  深度爬虫:深度爬虫的主要任务是访问google主索引中已经存在的网站,进行整体的服务器更新,目前google深度爬虫几乎可以每天更新一次,所以如果不注意观察是根本察觉不到的。但是百度深度爬虫的时间就要长一点,大概是一周进行深度爬行一次,所以许多做百度的seo,都盼望百度深度爬行,因为百度深度爬行,就意味着,自己上一周的工作将被百度肯定。

  今日重点

  这一节maoseomao将讲解google搜索引擎的具体工作流程,以及如何为我们提供搜索结果。

  

 

  【以上是笔者经过查看资料,画出的谷歌工作流程图,画的不是很好,希望大家谅解】

  第一步:google服务器整理,google每天派出大量更新爬虫,到互联网发现新的网站信息,然后带回google服务器等待进行整理。

  第二步:Google服务器进行整理后,索引到google主索引中去,将没有被索引的信息进行删除。

  第三步:Google服务器整理,每天放出google深度爬虫,爬行主索引,对资料采用关键词排名算法进行计算,列出名次,数据库稳定。

  第四步:用户输入主关键词时,GG服务器,将用户输入转换为计算机看的懂的内容,并向主索引索取答案。注意:GG服务器向主索引索取的答案是由:GG主索引内容+更新爬虫内容 一起组成的。

  第五步:主索引将关键词列表转换成字符流,交给GG服务器,GG服务器,再将答案显示给用户。

  Google何时开始为您打分

  以上便是google整个工作流程,对此工作流程比较有争议的是:google何时开始给您的网站关于某个关键词打分。

  据笔者观察,google是在爬行您的网站,收集网站信息时就开始记录您网站表现,关于网站的结构是否友好,网站链接相关度是否足够高,网页代码是否友好.......等这些排名因素。等到google服务器放出深度爬虫时,主索引根据排名算法进行排名时,更新爬虫会把自己的数据也递交给主索引,帮助排名算法进行工作。

  Google提供的搜索结果

  对于许多seo来说,google只有一种搜索结果--内容关键词结果。其实google提供的关键词搜索结果还有一种特殊结果--图片,pdt文件等。笔者建议各位seo适当的关注特殊搜索结果。

  要知道在未来,并不是单单内容搜索才能获得客户。

  下期预览

  今天google搜索引擎工作流程就说到这里,明天内容--搜索引擎排名原理,关注Page Rank(pr),以及我们如何正视这个排名“神话”。

  本文由陕西基石广告有限公司原创 http://www.jishiguanggao.com 版权所有

(责任编辑:IT教学网)

更多