搜索引擎有两个主要功能:爬行和构建索引,并为搜索用户提供他们确定的网站的排名列表最相关。
第一,抓取和索引。
在互联网上对数十亿个文档,页面,文件,新闻,视频和媒体进行爬行和编制索引。想象一下互联网是大城市地铁系统中的停靠网络。每个站点都是一个独特的文档,通常是一个网页,但有时是PDF,JPG或其他文件。搜索引擎需要一种方法来“爬行”整个城市并找到沿途的所有站点,因此他们使用最佳路径可用链接。
Web的链接结构用于将所有页面绑定在一起。链接允许搜索引擎的自动机器人称为“爬虫”或“蜘蛛”到达网络上数十亿个互连文档。一旦引擎找到这些页面,它们就会从它们中解密代码并将选定的部分存储在海量数据库中,以便稍后在搜索查询需要时进行调用。为了完成持有可在几分之一秒内访问的数十亿页面的巨大任务,搜索引擎公司已经在全世界构建了数据中心。这些巨大的存储设施可以容纳数千台机器,可以非常快速地处理大量信息。当一个人在任何一个主要引擎上进行搜索时,他们会立即要求结果;即使是一秒或两秒的延迟也会引起不满,因此引擎很难尽快提供答案。
第二,提供答案
提供用户查询的答案,最常见的是通过他们检索的相关页面列表以及相关性排名。搜索引擎是应答机器。当一个人进行在线搜索时,搜索引擎会搜索其数十亿个文档的语料库并做两件事:首先,它只返回那些与搜索者查询相关或有用的结果;第二,它根据服务信息的网站的受欢迎程度对这些结果进行排名。SEO的过程旨在影响它的相关性和普及性。
搜索引擎如何确定相关性和受欢迎程度?
对于搜索引擎,相关性不仅仅意味着找到具有正确单词的页面。在网络的早期,搜索引擎并没有比这个简单的步骤更进一步,搜索结果的价值有限。多年来,程序工程师已经设计出更好的方法来将结果与搜索者的查询相匹配。搜索引擎通常假设网站,页面或文档越受欢迎,其包含的信息必须越有价值。在用户对搜索结果的满意度方面,这一假设已被证明相当成功。流行度和相关性不是手动确定的。相反,引擎使用数学方程算法从相关性中分类,然后按质量以及流行度的顺序对内容进行排序。这些算法通常包含数百个变量。在搜索营销领域,我们将它们称为“排名因素”专门针对此主题制作了一个资源:搜索引擎排名因素。
如何获得成功?或者说是搜索营销如何成功呢?
搜索引擎的复杂算法似乎难以理解。实际上,引擎本身几乎没有提供如何获得更好结果或获得更多流量的洞察力。他们为我们提供的有关优化和最佳实践的内容如下所述:
来自BAIDU站长的SEO信息。BAIDU建议通过以下方式在搜索引擎中获得更好的排名:
1、制作主要面向用户的页面,而不是搜索引擎。不要欺骗您的用户或向搜索引擎展示与向用户显示的内容不同的内容,这种做法通常被称为“隐藏真实内容”。
2、创建一个具有清晰层次结构和文本链接的站点。应至少从一个静态文本链接访问每个页面。
3、创建一个有用的,信息丰富的网站,并编写清晰准确地描述您的内容的页面。确保<title>元素和ALT属性具有描述性和准确性。
4、使用关键字创建描述性的,人性化的网址。提供一个URL版本来访问文档,使用301重定向或rel=“canonical”属性来解决重复内容。
来自BING的SEO信息,微软的Bing工程师推荐以下内容,以便在搜索引擎中获得更好的排名:
1、确保使用干净,关键字丰富的URL结构。
2、确保内容不包含在富媒体中,并验证富媒体不会隐藏来自爬网程序的链接。
3、创建关键字丰富的内容并将关键字与用户搜索的内容进行匹配。定期制作新鲜内容。
4、不要将要编入索引的文本放在图像中。例如,如果您希望将公司名称或地址编入索引,请确保它不会显示在公司徽标中。
除了这种自由提供的建议之外,在网络搜索存在的15年多的时间里,搜索网站运维已经找到了提取有关搜索引擎如何对网页进行排名的信息的方法。SEO和网站运维使用这些数据来帮助他们的网站及其客户实现更好的定位。
研究引擎活动的网站管理员可能没有比利用搜索引擎本身进行实验,测试假设和形成意见的自由更多的工具。通过这种迭代,时是艰苦的过程,已经收集了大量关于发动机功能的知识。我们尝试过的一些实验是这样的:
1、使用无意义关键字注册新网站。
2、在该网站上创建多个页面,所有页面都针对类似的荒谬术语。
3、使页面尽可能接近相同,然后一次更改一个变量,尝试放置文本,格式化,使用关键字,链接结构等。
4、将域中的链接指向其他域上的已编制索引,爬网良好的页面。
5、记录搜索引擎中页面的排名。
6、现在对页面进行小的更改并评估它们对搜索结果的影响,以确定哪些因素可能会导致结果上升或下降。
7、记录任何看似有效的结果,并在其他域或其他术语上重新测试它们。如果多个测试始终返回相同的结果,那么您很可能会发现搜索引擎使用的模式。
我们从一个假设开始,即页面上较早链接比页面下方的链接承载更多的权重。我们通过创建一个带有主页的无意义域来测试这一点,该主页具有指向三个远程页面的链接,这三个远程页面都具有在页面上恰好出现一次的相同无意义单词。在搜索引擎抓取页面后,我们发现主页上最早链接的页面排名第一。这个过程很有用,但并不是唯一有助于教育搜索网站运维的过程。搜索网站运维还可以收集关于搜索引擎如何通过主要引擎用户企业的竞争情报。搜索网站运维作为一个社区已经开始了解搜索引擎的许多基本操作以及创建获得高排名和大量流量的网站和页面的关键组件。