8个常见的搜索引擎蜘蛛陷阱

蜘蛛陷阱是指网站设计时使用了对搜索引擎不友好的技术,不利于搜索引擎蜘蛛的爬行喝抓取,这些技术就被称为蜘蛛陷阱。下面为大家介绍常见的一些蜘蛛陷阱。

常见蜘蛛陷阱一:要求登陆

有些网站设置成必须要注册登陆后才能看到更多信息,而搜索引擎蜘蛛是不会注册、也不会登陆的,这样的设置会导致网站内容无法被收录,更别说优化排名了。

常见蜘蛛陷阱二:首页全部Flash

网站使用Flash来提升视觉效果是很正常的,比如用Flash做的广告、Logo、头部大图等,虽然搜索引擎无法识别Flash内容,但是对网站整体SEO的影响不大。

但是有些网站把整个首页设置成一个大的Flash文件,这种就是一个蜘蛛陷阱,因为搜索引擎完全无法判断网站首页的内容是什么。而网站首页的权重通常是最高的,也是最容易优化的,首页全部Flash的做法让后期SEO优化的工作变得非常困难。

常见蜘蛛陷阱三:过于复杂的动态URL

早期的搜索引擎对于动态URL的抓取能力比较差,所以一般都会在进行网站SEO优化时会采用URL伪静态的方式对动态URL进行处理。关于动态URL是否不利于搜索引擎的观点,目前存在一些争议,主流搜索引擎都声称自己完全有能力识别抓取动态URL的页面,但是在实际的网站建设中,还是不建议动态URL包含太多参数、过于复杂,因为参数太多肯定会跟搜索引擎蜘蛛带来一定的抓取难度。

常见蜘蛛陷阱四:各种跳转

对搜索引擎来说,只有301跳转是比较友好的,而其它形式的各种跳转都比较敏感,比如JavaScrit跳转、MetaRefresh跳转、Flash跳转、302跳转等,都被搜索引擎视为不那么友好的跳转。所以建议网站在做跳转的时候尽量采用对搜索引擎友好的301跳转,不要使用其他对搜索引擎不友好的跳转形式。

常见蜘蛛陷阱五:框架结构

框架结构Frame的网站现在都比较少,基本上都被div+css所取代框架结构是非常不利于搜索引擎蜘蛛抓取的,是典型的蜘蛛陷阱之一。

常见蜘蛛陷阱六:强制使用Cookies

有些网站为了实现某种功能,强制用户使用Cookies,而搜索引擎蜘蛛相当于一个禁用了Cookies的浏览器,强制使用Cookies的网站只能导致搜索引擎无法正常访问。

常见蜘蛛陷阱七:使用Session ID

有些网站使用Session ID跟踪用户访问,每个用户访问时都会形成一个特定的URL,其中就包含了Session ID的信息。而搜索引擎蜘蛛每次访问都会被当作一个新的用户,URL中也会加上一个不同的Session ID,这样就导致搜索引擎蜘蛛每次访问同一个页的URL都不一样。

搜索引擎遇到这种含有Session IDURL时,会尝试判断字符串属于正常参数还是Session ID,如果能成功判断出Session ID的话就会自动去掉Session ID收录正常的URL,但毕竟搜索引擎不是万能的,也存在无法成功判断Session ID的情况,这样就会导致搜索引擎不收录或者收录大量的内容完全相同的URL,形成大量的复制内容,不利于SEO优化。

因此,Session ID也是常见的搜索引擎蜘蛛陷阱之一。

常见蜘蛛陷阱八:使用JavaScript链接

有些网站喜欢使用JavaScript脚本生成导航系统,因为JavaScript可以创造出很多吸引人的视觉效果,这也是比较严重的蛛蛛陷阱因为搜索引擎对于解析JS脚本存在困难。

复杂的JavaScript链接不利于搜索引擎优化,是典型的搜索引擎蜘蛛陷阱之一。所以网站上的链接必须使用最简单标准的HTML链接,尤其是导航系统。用CSS做导航系统一样可以实现很多视觉效果。

以上便是为大家分享的8个常见的搜索引擎蜘蛛陷阱,希望大家在进行SEO优化时尽量避免这些蜘蛛陷阱。

网站内部链接对SEO的3大作用

大家都知道,外链能够提升网站的整体权重、提升关键词排名,那么內链对SEO又有什么样的作用呢?本文就与大家分享一下內链对SEO的作用。

內链对SEO的作用主要有以下几点:

1.降低跳出率;

网站跳出率是搜索引擎排名的一个重要指标,跳出率越低越好。如果在页面上做好內链,当用户看到自己感兴趣的关键词链接时,可能就会点击链接进行进一步的浏览,而这一行为就降低了网站的跳出率,对SEO有间接的正向作用。

2.引导权重分配,提升页面目标关键词排名;

一个网站的关键词布局是需要分层次的,需要我们根据关键词的重要及难易程度将关键词布局到首页、列表页、内容页等不同页面上,这就需要我们在做SEO工作时去提升这些页面的目标关键词的排名,而利用內链进行权重传递的方式,可以有效分配网站内部权重,提升页面的的目标关键词排名。

我们都知道,只要没有加Nofollow标签,那么链接就有传递权重的作用,內链也不例外。

基于这个原理,我们可以利用內链来分配网站的权重,对于重点的页面,比如首页、列表页等,可以通过內链的方式进行权重的传导,提升这些页面的整体权重。

另外,锚文本链接对特定关键词的排名是有利的(参考《谷歌炸弹》、《李彦宏超链分析专利》),那么我们在进行內链建设时,就利用锚文本链接的方式去提升页面的目标关键词,达到整站SEO的目标。

3.引导蜘蛛收录更多页面;

合理的內链可以引导蜘蛛抓取并收录更多的页面。

我们都知道,搜索引擎蜘蛛是顺着链接抓取网站内容的,那么,页面内容想要被蜘蛛抓取并收录,就一定要有链接指向这个页面,并且链接越多、质量越高,页面被收录的几率就越大。

通常来说,网站首页的权重最高,是蜘蛛爬行最频繁的页面,但是首页的页面有限,能放置的导入链接也是有限的,这样有些深层的内页可能就没获得推荐链接,难以被搜索引擎蜘蛛抓取,而內链恰好能有效地解决这个问题,合理的內链设置可以让搜索引擎蜘蛛沿着链接抓取到网站更多的页面,最终提升网站页面的收录率。

301转向的概念与作用

SEO工作中,可能经常听说310转向这个名词,那到底什么是301转向,它的作用又是什么呢?

所谓301转向,是指用户或搜索引擎蜘蛛向网站服务器发出访问请求时,服务器返回HTTP数据流中头信息部分的一种状态码,这个状态码标识本网址永久性转移到了另外一个地址。

比如A网站用301转向到B网站,那么当我们点击A的网址时,会自动跳转到B网站。

301对于SEO的意义还是很重要的,301转向是可以传递权重的。有些企业为了域名保护,会采用同一个网站,使用多个域名的方式,这个时候就可以选定一个主域名,然后把其他域名使用301定向的方式转到主域名,这样既不会出现大量的重复内容,也能把权重集中在主域名。

另外,网站改版时,难免会遇到需要改动URL的情况,这时就可以使用301转向把原先的内容完美地转移到新的URL下,不影响原先的搜索流量。

那么,如何实现301转向呢?

其实实现301转向的方法很多,最原始的方法是修改主机根目录的文件指令。如果网站使用LAMPLinux+Apache+MySQL+PHP)主机,可以使用.htaccess文件做301转向。.htaccess是一个普通文字文件,用Notepad等文字编辑软件创建和编辑,存在网站根目录下。.htaccess文件中的指令用于目录特定操作,如密码保护、转向、错误处理等。

另外,现在很多企业管理网站都是使用CMS系统,很多成熟的CMS系统都设置了301定向的功能,操作非常简单。

如何吸引搜索引擎蜘蛛

搜索引擎对网站的收录、排名都是由搜索引擎蜘蛛所抓取的数据进行处理的,网站想要获得良好的收录及排名,就需要有搜索引擎蜘蛛持续地对网站进行抓取。

本文就与大家分享一下关于搜索引擎蜘蛛的一些知识。

理论上讲,搜索引擎蜘蛛可以爬行、抓取到互联网上的所有页面,但实际上来说,受制于资源的限制,没有一个搜索引擎可以做到抓取所有页面,实际上也没有这个必要,因为对于搜索引擎来说,收录到一些垃圾页面并且导入流量过去,对用户的体验反而是不好的。

所以,搜索引擎蜘蛛会有限制地对网络上的页面进行抓取,那也就意味着你的页面、内容是不一定能被抓取、收录的。

被搜索引擎蜘蛛认为是重要、有价值的页面,获得的抓取、收录几率就会比较高一些。

那么,如何才能让搜索引擎认为是有价值的页面呢?主要有以下几个方面的要素:

 

1.权重高的网站。

权重高的网站会被蜘蛛优先爬行及抓取,这些网站的内页被收录的几率都是比较高的,比如你在一个新网站的首页发表的文章可能没有被收录,但是同样的文章,发布在新浪博客上,反而被收录了,这就是因为新浪博客的权重非常高,搜索引擎蜘蛛会优先去抓取它的内容。

 

2.导入链接

我们都知道,搜索引擎蜘蛛是顺着链接去抓取网络上的内容的,链接相当于蜘蛛的路,如果一个网站或页面的导入链接多了,就相当于有很多条路能找到这个网站或页面,蜘蛛能过来爬行抓取内容的概率就高了很多。

当然,还要看导入链接的数量与质量,这个会在网站链接相关的文章中再进行介绍。

 

3.页面更新情况。

搜索引擎蜘蛛对网站或页面进行抓取后,会把数据存储起来,如果下次爬行发现页面与第一次收录的完全一样,也就代表页面是没有更新的,那么为了避免自己有限的资源,蜘蛛就可能会调低过来抓取的频率,对于网站来说,保持相对固定的更新频率更有利于搜索引擎蜘蛛进行有规律地抓取。

上面三种方法是吸引蜘蛛的基础,在这些基础上会有一些SEO的技术或者操作细节,比如蜘蛛池、页面在网站的位置等等,其实都是以上三种方法的变体。把SEO基础学好了,才能做到万变不离其宗的效果。