来源:www.wangzhan.net.cn 时间:2020-10-29 10:15:32 浏览:2181次
搜索引擎对链接价值的判断因为篇幅比较厂的原因,笔者选择分为两个章节来进行分析。一来是长篇幅的文章在字数过长,页面拉至厂,如果分页的化则不利于搜索引擎爬网收录;二来对于新进入行业的朋友来说,分开来进行编辑更有助于大家的学校和理解,比较是需要知识的“消化”时间的。闲言不多说,笔者下面继续笔者未完成的关于链接质量判断的方式。
1、主题相关性
搜索引擎可以通过多种方式运行主题分析,以确定两个页面或站点是否涵盖了相似的主题。几年前,谷歌实验室采用了一种自动分类工具,该工具可以基于URL预测几乎任何类型的内容从医疗到房地产,市场营销,体育等数十种内容的类别和子类别。搜索引擎可能会使用这些自动的主题分类系统来识别特定主题周围的“邻居”,并根据他们认为对排名结果质量有影响的行为或多或少地对链接进行计数。被子个人不必太担心主题的相关性,如果笔者可以从与主题无关的网站或完全不相关的主题的非常特定的博客中获得链接,笔者认为这些非主题特定的认可可能仍会传递正值。笔者认为搜索引擎更有可能根据这些分析来评估潜在的垃圾链接或操纵性链接。以前从未链接到制药,赌博或成人主题区域名的网站在潜在的垃圾链接情况下可能会在链接图上显示为异常值。
2、网站内容和上下文评估
尽管主题相关性可以为搜索引擎提供有关链接关系的有用信息,但是链接的内容和上下文可能在确定它应该从源传递到目标的值时甚至更有用。在内容或上下文分析中,搜索引擎尝试以机器可解析的方式识别页面上为什么存在链接。当链接的含义是社论时,就会出现某些模式。它们倾向于嵌入到内容中,链接到相关资源,对HTML结构,关键词用法,措词,语言等使用公认的规范。通过详细的模式匹配以及可能的大数据集机器学习,搜索引擎可能是能够在构成合法链接和经编辑赋予链接的目的上进行区分,这些链接旨在作为代言对象,而那些可能被秘密放置通过黑客入侵的链接,是那些内容许可的结果但没有其他重要作用,按展示位置付费的广告等。
3、链接的地理位置
链接的地理位置高度取决于其主机的感知位置,但是搜索引擎尤其是百度在采用数据点来确定根域名,子域名或子文件夹的位置相关性方面变得越来越复杂。这些可以包括:主机IP地址位置、国家/地区代码TLD扩展名、内容的语言形式、在本地搜索系统和/或区域名目录中注册、与实际地址的关联、指向该站点/部分的链接的地理位置。从定位到特定区域名的页面/站点获得链接可以帮助该页面或整个站点在该区域名的搜索中表现更好。同样,如果笔者的链接配置文件强烈偏向某个特定区域名,则即使存在其他位置标识数据如托管IP地址,域名扩展等,也可能很难在另一个区域名中突出显示。
4、链接中使用了Rel =“Nofollow”
尽管在SEO世界中,自nofollow出现以来就好像很长时间,但实际上它只是在2005年1月左右才出现,当时谷歌宣布采用对新HTML标签的支持。很简单,当rel =“nofollow”附加到链接时,告诉搜索引擎不要归因于任何会增加页面/站点查询独立排名指标的编辑背书或投票。如今,Linkscape的索引指出,网络上所有链接的大约3%被nofollow,其中一半以上是在内部而非外部指向链接上使用nofollow的网站。对于Nofollow对链接的影响,通常我们认为SEO领域存在一个问题,即每个单独的搜索引擎是否以及严格遵守此协议。如通常有seoer声称使用了nofollow,但谷歌仍可能通过Wikipedia的外部链接传递某些引用质量。
5、构建链接的类型
链接建设可以有多种格式,一般包含了三大要素是:直HTML文本链接、图片链接、Java链接。搜素引擎谷歌表示他们不仅要抓取这第三类,还要通过它们传递链接认可指标,这对于使用Java来描述付费广告链接的方式的政策逆转有很多不满)。一直以来搜索引擎还以类似于在标准文本链接中处理锚文本的方式来处理图片的alt属性中的文本。但是,并非所有链接都得到同等对待。在一些测试中,似乎带有标准锚文本的直接HTML链接传递了最大价值,其次是带有关键词丰富的alt文本的图片链接,最后是Java链接,不过SEOer未对这规则普遍遵循或认可,至少在笔者的SEO经验中是这样的。故笔者认为链接建设者,内容编辑和原创内容创建者以及那些启用可嵌入内容的人,应该对搜索引擎处理和传递非标准链接的价值的能力承担最坏的假设,并力求使HTML文本链接具有良好的质量。锚文本作为一种最佳方法。
6、源页面上的其他链接目标
当网站页面从外部链接出去时,搜索引擎在确定应该传递多少链接汁时可以考虑该页面上存在的其他链接的数量和目标。正如笔者上面已经提到的所有搜索引擎中类似PR或BR的算法将给定页面传递的果汁量除以该页面上的链接数。除此指标外,引擎还可以考虑页面指向的外部域名的数量,以此来判断这些背书的质量和价值。如,如果某个页面仅链接到特定主题上的几个外部资源,则这些内容在内容中散布开来,那么与指向许多不同外部站点的一长串链接相比,该页面可能会有所不同。一个搜索引擎不一定比另一个更好或更糟,但是搜索引擎通过一个模型的认可可能比另一个模型更大且可以使用像这样的系统来降低从他们认为低价值目录中发送的链接的价值。搜索引擎也很有可能正在查看链接页面认可的对象。我们几乎可以肯定的是从一个页面链接到可能被视为垃圾链接的低质量页面也比从认可并链接到高质量,信誉良好的域名和URL的页面接收链接的价值要低。
7、对于特定域名,页面和链接的处罚
几乎所有SEO行业的人都知道搜索引擎会对网站和页面施加惩罚,从丧失传递链接评分/认可的能力一直到完全禁止他们的索引。如果页面或站点失去了通过链接认可的能力,则从该页面或站点获取链接不会为搜索排名提供任何算法价值。值得我们注意的是搜索引擎有时会公开显示处罚像无法为明显的标题/ URL匹配排名,降低PR或BR得分等,但会继续保持这些处罚不一致,因此系统操纵者无法获得有关谁可以被击中的可靠数据与否。
8、链接内容/嵌入模式
随着内容许可和分发,窗口和分布式的,可嵌入的内容内链接在网络上变得越来越普遍,搜索引擎开始寻找避免被这些策略所淹没的方法。笔者不认为搜索引擎不希望计算使用这些系统的绝大多数链接,但是他们也对过多计算或过度代表站点仅在分配单个站点方面表现出色表示警惕小工具/嵌入式/许可交易。为此,在SEOer认为内容模式检测和链接模式检测可能会在搜索引擎评估链接多样性和质量的方式中发挥作用。如,如果搜索引擎在数千个站点中看到具有相同链接的相同内容,则可能表示不同的唯一链接类型和周围内容将提供相同的认可水平。与明显独特的自生成链接相比,高度相似的代码片段的编辑性质值得,但是从搜索引擎的角度来看,能够使用这些属性识别并过滤链接是未来实现这一目标的明智之举,反对操纵的证据。
9、链接的时间和相关历史数据
有关链接出现的时间和数据是此清单的最后一点。当搜索引擎搜寻网络并查看新站点,新页面和旧站点如何获得链接的模式时,它们可以使用这些数据来帮助打击垃圾链接,确定权限和相关性,甚至为链接获取中快速上升的页面提供更高的新鲜度。搜索引擎如何使用链接吸引的这些模式尚待辩论和猜测,但几乎可以肯定,数据将被消耗,处理和利用,以帮助排名算法更好地发挥最佳效果并减少垃圾链接的能力,特别是大型链接购买或漏洞利用对排名产生影响。
搜索引擎对于链接质量判断的方式基本上总结为这些,当然上面的内容也不是全部的数据内容,应该还有一些尚未被我们所发现的判断标准。这就需要我们在以后的工作中慢慢摸索了。
上一篇:用户对什么样的标题不可抗拒?
下一篇:搜索引擎判断链接价值的方式一
24小时服务热线:400-1180-360
业务 QQ: 444961110电话: 0311-80740308
渠道合作: 444961110@qq.com
河北供求互联信息技术有限公司(河北供求网)诞生于2003年4月,是康灵集团旗下子公司,也是河北省首批从事网站建设、电子商务开发,并获得国家工业和信息化部资质认证的企业。公司自成立以来,以传播互联网文化为已任, 以高科技为起点,以网络营销研究与应用为核心,致力于为各企事业单位提供网络域名注册、虚拟主机租用、网站制作与维护、网站推广和宣传、网站改版与翻译、移动互联网营销平台开发与运营、企业邮局、网络支付、系统集成、软件开发、电子商务解决方案等优质的信息技术服务,与中国科学院计算机网络信息中心、腾讯、百度、阿里巴巴、搜狗、360、电信、联通、中国数据、万网、中资源、阳光互联、点点客、北龙中网、电信通等达成战略合作伙伴关系。