当前位置:首页 > 长沙网站建设 > 搜索引擎收录网站的原理

搜索引擎收录网站的原理

优度网络 1498

控录蜘蛛和控寻机器人

搜索引擎要知道网上的新生事物,就是派人出去搜集。但是靠人工是不可能完成这个任务的。所以,搜索引擎的发明者就设计了计算机程序,派它们来执行这个任务。

探测器有多种叫法,也叫crawler(爬行器)spider(蜘蛛)robot(机器人).这些形象的叫法是描绘搜索引擎派出的蜘蛛机器人爬行在互联网上探测新的信息。Google把它的控测器叫做googlebot,百度就叫Baiduspider,MSNMSNbot,Yahoo则称为Slurp.这个控测器实际上是人们编制的计算机程序,由它不分昼夜地进入访问各个网站,取回网站内容、标签、图片等,然后依照搜索引擎的算法给它们制定成索引。所以,这可不是“爬行”而是以光速来访问的。

一个搜索引擎会同时派出许多控测器。这些“机器人”或者从站主直接呈递的网站URL去访问,或者由一个网络用户所装的搜索引擎工具栏(比如GOOgle工具栏)得知用户去的网站,或者是从一个网站中指向另一个网站的链接过去。控测器不一定是从网站的首页进入访问,所以,如果你要探测器访问你其他的网页,那么这个进入页就需要和其他网页相连。达到这个目的最容易的办法就是在每一页都加入指向首页的链接。

但是,探测器对许多网站是不能完整取回信息的,这个大多是由于网站的设计没有按照搜索引擎控测器的思路来进行优化。比如,如果一个网页比较大,控测器也只能截取网页的首部,而且只能跟着少量的链接走。Google目前能够吸收100KB的文件,Yahoo会多一点。这个可以通过实验来检验。将一个搜索关键词放在一个很长的网页(约160KB)最后部分,然后看Google的缓存(cache)中显现网页的大小是多少。如果不出意料,Googlecache说这个网页只有101KB。很显然,一部分内容没被Google抓走。

这个现象告诉我们不要将网页设计得很长、很大。将大的网页拆成若干小的网页具有很多的好处:

1、  使得网页容易被探测器抓取。

2、  更容易建立合理的网站内部链接关系。

3、  每个网页可以更加集中在重要的关键词语。

4、  节省服务器的带宽。

5、  方便浏览者的阅读。

发表评论
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

相关文章

2021年优度成功签约并完成泰坦凝胶官网

2021年优度成功签约并完成泰坦凝胶官网

此网站采用标准网站建设方案,PC+移动自动转换模式,网站产品为一款火爆的微商产品,也是一款男性用品。...

备案与没备案的新网站老域名为什么百度都不收录?

备案与没备案的新网站老域名为什么百度都不收录?

现在互联网越来越难做,百度的门槛越来越高,以前新网站上线提交后3天就会收录,现在新网站上线每天提交还不一定会收录,必须结合外链才有效。...

做好“着陆页”,公司销售业绩将提升一大步

做好“着陆页”,公司销售业绩将提升一大步

当今,一个能在用户寻找“返回”按钮之前抓住用户眼球的着陆页比以往任何时候都更有商业价值。值得庆幸的是,一个好的着陆页面的设计过程比以往更加容易把握,诀窍在于弄清楚实现这个非常重要的切入点所需的核心要素...

什么是关键词?

什么是关键词?

关键词就是你向搜索引擎发出的一个指令,是让搜索引擎帮助你查找相关信息的命令,它可以是一个字,也可以是一个词、一句话、一个英字母、英文单词、一个数字、一个符号等任何可以在搜索框中输入的信息。...

什么样的网站才是一个合格的SEO网站?

什么样的网站才是一个合格的SEO网站?

在讲网站之前还是来介绍一下什么是网站,因为这里的学员还有很多SEO初学者,网站就好比是我们在某个商场、某个小区开的一个店铺,你做生意肯定是有一个店铺的对吧,那么网站就是一个互联网上的店铺,是一个虚拟的...