杭州网站建设之搜索引擎的工作原理简析-蒙特

杭州网站建设之搜索引擎的工作原理简析
时间：01-22

　　搜索引擎的工作原理那是相当的复杂的，我们不能全面的详细的阐述，但是我们可以大概的了解一下搜索引擎的工作原理，这样有助于我们更好地做网站优化。那么今天杭州网站建设的小编就简单的给大家针对搜索引擎的工作原理做一个简单的阐述：

　　搜索引擎用来爬行和访问页面的程序被称为蜘蛛(spider)，也称为机器人(bot)。

　　搜索引擎蜘蛛访问网站页面时类似于普通用户使用的浏览器。蜘蛛程序发出页面访问请求后，服务器返回HTML代码，蜘蛛程序把收到的代码存入原始页面数据库。搜索引擎为了提高爬行和抓取速度，都使用多个蜘蛛并发分布爬行。

　　蜘蛛访问任何一个网站时，都会先访问网站根目录下的robots.txt文件。如果robots.txt文件禁止搜索引擎抓取某些文件或目录，蜘蛛将遵守协议，不抓取被禁止的网址。

　　2.跟踪链接

　　为了抓取网上尽量多的页面，搜索引擎蜘蛛会跟踪页面上的链接，从一个页面爬到下一个页面，就好像蜘蛛在蜘蛛网上爬行那样，这也就是搜索引擎蜘蛛这个名称的由来。

　　整个互联网是由相互链接的网站及页面组成的。从理论上说，蜘蛛从任何一个页面出发，顺着链接都可以爬行到网上的所有页面。当然，由于网站及页面链接结构异常复杂，蜘蛛需要采取一定的爬行策略才能遍历网上所有页面。

　　最简单的爬行遍历策略分为两种，一种是深度优先，另一种是广度优先。

　　所谓深度优先，指的是蜘蛛沿着发现的链接一直向前爬行，直到前面再也没有其他链接，然后返回到第一个页面，沿着另一个链接再一直往前爬行。

　　3.吸引蜘蛛

　　由此可见，虽然理论上蜘蛛能爬行和抓取所有页面，但实际上不能、也不会这么做。SEO人员要想让自己的更多页面被收录，就要想方设法吸引蜘蛛来抓取。既然不能抓取所有页面，蜘蛛所要做的就是尽量抓取重要页面。哪些页面被认为比较重要呢?有几方面影响因素。

　　1、网站和页面权重。质量高、资格老的网站被认为权重比较高，这种网站上的页面被爬行的深度也会比较高，所以会有更多内页被收录。

　　2、页面更新度。蜘蛛每次爬行都会把页面数据存储起来。如果第二次爬行发现页面与第一次收录的完全一样，说明页面没有更新，蜘蛛也就没有必要经常抓取。如果页面内容经常更新，蜘蛛就会更加频繁地访问这种页面，页面上出现的新链接，也自然会被蜘蛛更快地跟踪，抓取新页面。

　　3、导入链接。无论是外部链接还是同一个网站的内部链接，要被蜘蛛抓取，就必须有导入链接进入页面，否则蜘蛛根本没有机会知道页面的存在。高质量的导入链接也经常使页面上的导出链接被爬行深度增加。

　　4、与首页点击距离。一般来说网站上权重最高的是首页，大部分外部链接是指向首页的，蜘蛛访问最频繁的也是首页。离首页点击距离越近，页面权重越高，被蜘蛛爬行的机会也越大。

　文本由杭州网站建设整理转载请注明出处www.mountor.cn

　　搜索引擎用来爬行和访问页面的程序被称为蜘蛛(spider)，也称为机器人(bot)。

　　2.跟踪链接

　　最简单的爬行遍历策略分为两种，一种是深度优先，另一种是广度优先。

　　所谓深度优先，指的是蜘蛛沿着发现的链接一直向前爬行，直到前面再也没有其他链接，然后返回到第一个页面，沿着另一个链接再一直往前爬行。

　　3.吸引蜘蛛

　　1、网站和页面权重。质量高、资格老的网站被认为权重比较高，这种网站上的页面被爬行的深度也会比较高，所以会有更多内页被收录。

　文本由杭州网站建设整理转载请注明出处www.mountor.cn

【上篇】杭州网站建设利用微博如何做网站优化?
【下篇】杭州网站建设之做百度文库的注意事项

> 返回列表页

　　蒙特，英文：Mountor，全称：杭州蒙特信息技术有限公司。蒙特是专注于互联网移动互联网技术研发、销售、服务于一体的高新技术企业。我们秉着客户第一的理念，真诚地为各行业、各平台每一位客户提供最专业最贴心的高品质服务，同时提供免费的专业平台规划建议。您的企业利用互联网、移动互联网持续蓬勃发展、蒸蒸日上，是蒙特人最大的成功!

　　蒙特成立于2000年7月6日，自成立以来，蒙特不断创新研发，已成长磨砺了21年，拥有11个软件项目著作权，服务于政府、国企、上市公司、中高端企业等上万家客户。其中10年以上的客户有5000多家，蒙特服务过的众多客户，对蒙特皆留下了深刻的印象和良好的建站口碑。

　　作为高端品牌专业网站搭建的资深企业，主要提供电商网站建设、手机网站建设、微网站建设、微信公众平台开发、APP开发、微信公众号托管代运营、OA办公系统等互联网专业性服务。蒙特积极吸纳杭州地区的高校人才资源优势，不断充实自身设计与技术力量，以求为客户带来最满意的视觉体验与最安全的网站保障。蒙特现有团队151人，均为本科以上学历，其中有27名党员和16名预备党员。

　　蒙特旗下子公司——汉博数字技术有限公司专注于为客户提供因特网接入(全省21家接入商之一)、网站报修、网站安全检测、网站安全加固、网站运营、域名注册、网站备案等网站服务，汉博有望成为全省第三家为经营性网站提供安全检测和加固的服务商，为您的企业平台健康发展保驾护航!

法律声明 \| 网站地图
咨询热线：0571-88230881 15158184365

网络推广

公司动态

行业动态

网站建设

媒体聚焦

领导关怀

网络推广

信息与安全

观点与报告

案例剖析

技术支持：