网站结构对SEO的影响

网站结构有两方面的意思,一是物理结构,二是链接结构,下面分别为大家介绍一下。

一、网站物理结构

网站物理结构指的是网站目录及文件所在的位置决定的结构。

一般来说常用的网站物理结构分为两种,一种是扁平式的,也就是将所有网页文件都存放在网站根目录下;另一种是树形结构,又叫金字塔结构,这种结构是指根目录之下又分了多个产品分类,然后在每一个分类下再放置属于这个分类的具体产品,整个结构看起来就像是金字塔,从上到下越来越宽。

通常扁平结构只适合于小型网站,因为所有文件都放在根目录下,制作和维护比较麻烦,也比较容易搞乱。不过扁平结构的好处就是各个页面之间没有隶属关系,获取权重比较平均。

大型一点的网站通常都会采用树形结构,树形结构的好处是分类逻辑清晰,页面之间的隶属关系一目了然,权重分配也按照隶属关系进行从上至下的分配。

数据库驱动、程序生成的网站并不存在真实的目录和文件,URL中的目录和文件都是程序实时生成的,但就网站结构来说,与真实存在的目录和文件没有什么区别。

二、网站连接结构

网站结构的第二个意义指的是连接结构,或者称为逻辑结构,也就是根据网站链接指向形成的结构。

通常来说,比较合理的链接结构是树形结构。

对于搜索引擎来说,链接结构比物理结构更加重要,页面的权重分配以及是否容易被收录,主要跟页面的链接结构位置有关系,通常来说,距离首页点击距离越近的页面能分配到的权重越高,能被收录的概率也越高。

大家在设计网站链接结构的时候应该注意不要把点击次数设计得过深,点击距离越深的页面越难被收录,特别是在网站总体权重不高的情况下,点击距离越少越好。

以上便是为大家分享的网站结构对SEO的影响,希望能对大家进行SEO工作有所帮助。

子域名和目录的区别丨SEO经验

新手SEO经常搞不懂子域名与目录的区别,也不清楚如何在SEO中区别对待子域名与目录,本文就由HC工作室与大家分享一下子域名与目录的区别以及两者在SEO中的应用。

搜索引擎通常会把子域名当做一个独立的站点,比如http://waibao.hc-seo.comhttp://www.hc-seo.com就是两个相互独立的站点(其实http://www.hc-seo.com也是http://hc-seo.com的一个子域名,只是通常大家都把带www的域名作为了网站的主域名,而把不带www的域名通过301定向给定向到了带www的域名上),而http://www.hc-seo.com/waibao就是http://www.hc-seo.com/的一部分,是主站的一个目录。

如果网站上分别有http://waibao.hc-seo.comhttp://www.hc-seo.com/waibao

抛开网站结构、内容、链接等因素,子域名先天比目录拥有更高的权重,因为搜索引擎会把子域名的URL当做网站首页,另外,主域名会传递一定的信任度给子域名。

所以,单纯就URL来说,子域名比目录的权重和排名能力都要稍微高一些。那么,这是不是意味着我们在进行网站优化时,应该使用子域名而不是目录呢?

其实并不完全是这样的,因为子域名与主域名是两个完全不同的网站,如果使用子域名,那么就相当于要重新做一遍SEO工作,尤其是外链建设。

所以,一般只有大型的网站才会使用子域名的方式来做优化,中小型企业网站优化一般不需要使用子域名,而是使用目录来做优化。

以上便是HC工作室为大家介绍的子域名与目录的区别以及在SEO中的应用,希望对广大中小企业网站优化提供参考。

网站日志中的HTTP状态码分别代表什么含义丨SEO基础知识

每个SEOer都需要进行网站日志分析,那么我们就必须懂得网站日志中的内容是什么含义,其中比较重要的就是要读懂HTTP状态码。如下所示:

61.135.166.232 – – [31/Dec/2007:02:30:11 +0800] “GET /category21.html HTTP/1.1” 200 10968 “-” “Baiduspider+(+http://www.baidu.com/search/spider.htm)”

以上日志内容中的200即代表服务器已成功处理了请求并提供了请求的网页,下面为大家罗列一下HTTP状态码分别代表的含义有哪些:

成功2××          成功处理了请求的状态码。
200                   服务器已成功处理了请求并提供了请求的网页。
204                   服务器成功处理了请求,但没有返回任何内容。                         
重定向3××       每次请求中使用重定向不要超过 5 次。
301                   请求的网页已永久移动到新位置。当URLs发生变化时,使用301代码。搜索引擎索引中保存新的URL。
302                   请求的网页临时移动到新位置。搜索引擎索引中保存原来的URL。
304                   如果网页自请求者上次请求后没有更新,则用304代码告诉搜索引擎机器人,可节省带宽和开销。
客户端错误4××  表示请求可能出错,妨碍了服务器的处理。
400                    服务器不理解请求的语法。
403                    服务器拒绝请求。
404                    服务器找不到请求的网页。服务器上不存在的网页经常会返回此代码。
410                    请求的资源永久删除后,服务器返回此响应。该代码与 404(未找到)代码相似,但在资源以前存在而现在不存在的情况下,有时用来替代404 代码。如果资源已永久删除,应当使用 301 指定资源的新位置。
服务器错误5××   表示服务器在处理请求时发生内部错误。这些错误可能是服务器本身的错误,而不是请求出错。
500                     服务器遇到错误,无法完成请求。
503                     服务器目前无法使用(由于超载或停机维护)。通常,这只是暂时状态。

以上便是HC工作室为大家分享的网站日志中的HTTP状态码代表的含义,希望能对大家进行网站日志分析提供帮助。

首选域对SEO的影响及设置方法丨广州SEO

刚接触SEO优化的小伙伴可能对一些概念性的知识不是很明白,在这里我们HC工作室为大家介绍一个跟SEO有关的概念:首选域,并且介绍一下首选域对SEO的影响以及正确设置首选域的方法。

首选域的概念如下:

首选域是站长或网站管理员希望搜索引擎用于网页建立索引的域(有时也指规范域),简单来说,就是网站首选的域名。举个例子:

hc-seo.com

www.hc-seo.com

这两个域名都会指向本站的首页,但是输入其中一个(hc-seo.com)的时候,网址栏会自动跳转到另一个(www.hc-seo.com),这是因为我们设置了www.hc-seo.com为我们网站的首选域。

一般我们在建站初期便需要对首选域的选择做出规划,以免影响后期网站SEO优化的表现。

首选域对网站SEO的影响如下:

1.不设置首选域会导致网站权重分散。

我们都知道,一个网站的总体权重值是一定的,那么如果不设置首选域,就相当于把权重分散到了几个不同的域名上,这样会导致权重分散,不利于网站总体优化。

2.不设置首选域会让搜索引擎误认为是重复内容。

比如hc-seo.com、www.hc-seo.com两个域名的内容是完全一模一样的,如果不设置其中一个为首选域,那么在搜索引擎看来,这就是内容完全重复的两个网站,这样就可能导致搜索引擎的惩罚。

3.不设置首选域会让用户感到困惑。

如果不设置首选域,可能会出现同样的内容、不同的url同时出现在搜索结果中,这也会给用户带来困惑,感到网站不专业甚至是钓鱼网站的可能。

正确设置首选域的方法:

比较简单的方法就是将不是首选域的网址做一个301定向到选定的首选域上面。

另外,如果你是用的CMS建站,那么找一下是否有首选域的设置选项,现在市面上的CMS系统都会考虑到网站SEO的需求,通常都是可以直接设置首选域的。

通常来说,我们都会设置网站主域名或者带www的二级域名作为首选域,而且设置带www的二级域名作为首选域的占比更大,这是因为用户习惯的问题,大多数用户习惯了网站就是带www开头的网址,顺应用户习惯对网站优化肯定是有好处的。

以上便是为大家分享的首选域的概念以及设置方法,希望对大家学习SEO有所帮助。

什么是反向链接【SEO概念】

刚接触SEO的朋友先要学好SEO所涉及的基本概念,本文就由HC工作室为大家介绍一个SEO的概念——反向链接

SEO中谈到的反向链接又叫做网站的导入链接,下面我们举个简单的例子帮助大家理解这个概念。

我们网站(www.hc-seo.com)做了一个链接到韩峰博客(www.hanfeng8.com),那么对于韩峰博客来说,这个链接就是一个反向链接,也是一个外部链接。

但反向链接并不都是外部链接,同一个网站的不同页面之间也会存在反向链接,但这种链接就属于内部链接。

比如我们www.hc-seo.com有页面A做了一个链接指向了页面B,那么对于页面B来说,这个链接就属于反向链接,但是这两个页面都属于同一个网站,所以这个链接也是一个内部链接。

以上便是HC工作室为大家介绍的反向链接的概念,希望大家牢牢掌握,为今后SEO水平的提升打好基础。

404页面对SEO的影响丨广州SEO

本文由广州HC网络营销工作室为大家介绍一下404页面的定义及其对SEO优化的影响。

404页面的定义及产生的原因:

404页面是客户端在浏览网页时,服务器无法正常提供信息,或是服务器无法回应,且不知道原因所返回的页面。

404 错误意味URL是无效的,造成这种404的原因主要有很多,比如用户输出或点击了错误的URL地址、网站URL生成规则改变、网页文件发生变化(如更名或移动),这些都会导致网站出现404页面。

404页面对SEO的影响:

1.正确设置404可以避免出现死链接,避免搜索引擎惩罚;

搜索引擎通过HTTP状态码来识别网页的状态,网站设置404后,如果网站出现了死链接,那么搜索引擎蜘蛛在抓取这类链接时就会返回“404”,这样搜索引擎就知道这个URL已经失效,就不会再索引该页面,也会在数据库中删除这个URL

而如果网站404页面返回200302状态码,搜索引擎就会为该链接建立索引,这会导致大量不同的链接指向了相同的网页内容,这样会导致搜索引擎认为网站存在大量的重复内容,从而对降低对网站的信任度,严重时还会直接被惩罚甚至K站。

2.设置404页面可以提升用户体验,降低跳出率。

设计良好的404页面可以引导用户对网站的其他内容进行浏览,避免用户看不到内容就直接跳出。

跳出率过高对关键词排名是有不利影响的,因此好的404页面从某种程度上对关键词排名是有好处的。

百度清风算法1.0【SEO算法】

为了保障用户的搜索体验,百度搜索推出清风算法1.0,旨在打击网站通过网页标题进行作弊,欺骗用户并获得点击的SEO作弊手法。

根据百度发布的《百度搜索内容质量白皮书-网页标题作弊详解》,我们可以看到百度对网页标题作弊的定义如下:

标题作弊主要指标题内容虚假、或在标题中故意堆砌关键词等行为。

标题内容虚假指标题表述的内容与网页内容不相符,有欺骗用户嫌疑。

标题故意堆砌指在标题中多次重复、过度堆砌关键词

下面为大家介绍一下百度认为的常见的标题作弊行为有哪些。

标题作弊行为一:假冒官网

用户在搜索引擎进行搜索时,会搜索自己想要登陆的网站品牌(导航词),而有些网站就想蹭同行业知名网站的流量,把自己的网站标题设置成同行网站的品牌名,然后还加上“官网”的字样,这就是一种明显的标题作弊行为。

标题作弊行为二:未提供标题表述的内容或服务

比如有些网站标题写着提供“TXT”文件的下载,但是我们进入网站后却发现网站并没有提供“TXT”文件下载的服务,那么这就是一个标题作弊行为。

有的网站为了蹭相关关键词的流量,把标题设置成相关的关键词,但是网站内却没有相对应的内容,满足不了用户的搜索需求,这都是属于标题作弊的范畴。

标题作弊行为三:网站提供的服务与标题表述的不同

比如标题表述为小说下载,但是网站上提供的却是APP的下载;还有我们在搜索引擎搜索某个软件下载的时候,进入到一个下载页面,下载下来的软件并不是我们搜索的软件,而是360软件管理助手之类的,这些行为都对搜索用户的体验造成了伤害,是典型的标题作弊。

标题作弊行为四:标题关键词大量重复

标题对SEO排名的影响是非常大的,有些站长为了把某个核心关键词优化上去,就在标题中大量重复该关键词,以获得该关键词排名的提升,这种行为也是百度要打击的标题作弊行为之一。

标题作弊行为五:标题堆砌关键词

这种方法有点类似于早期在关键词标签中堆砌关键词的手法,就是把网站要做的大量关键词都放在网站标题中,以提升这些关键词的排名。

以上便是为大家介绍的百度清风算法1.0的相关知识,希望大家在网站优化的过程中避免以上那些被百度认为作弊的行为,从而避免网站收到百度的惩罚。

百度绿萝算法【SEO算法】

百度绿萝算法是百度在2012年推出的一个搜索引擎算法,绿萝算法的目的是打击超链接作弊,绿萝算法推出后,对以下几类网站造成了较大的打击:

1.超链中介;

SEO的站长都需要进行外链的发布,所谓有需求就有供应,很多超链中介应运而生。一般来说,这些中介平台提供的服务有两种,一种是可以让站长们发布友情链接交换的信息,自由交换友情链接,另一种就是提供链接出售的信息。

虽然百度绿萝算法号称对超链中介是严厉打击的,刚出台这个算法的时候绝大部分外链平台也都受到很大的影响,但是毕竟还是有超链中介存活下来。更为搞笑的是,有些超链中介还在百度开通了竞价推广,大大方方地推广外链交换与销售的业务。

当然,这也许说明了随着搜索引擎算法的完善,链接在搜索引擎排名中占的比重没那么大了,或者说搜索引擎能够更好地识别超链接作弊,单靠超链接作弊没有办法再获得排名的优化了。

2.出卖链接的网站;

有些网站靠出卖链接为生,通常这种网站都是在互联网上自动采集的内容,通过链接、刷流量等方式提升自己的权重,然后进行链接的销售。

虽然绿萝算法对出售链接的网站进行了打击,但还是有些靠出售链接为生的网站在打击中存活了下来,可能他们做到了没有被搜索引擎判断为链接销售站。

3.购买链接的网站;

我们都知道,超链接对于搜索引擎具有投票意义,而购买链接相当于购买了一个选票,这种行为就相当于贿选,会影响搜索引擎对网站的判断,是搜索引擎最不想看到的,因此,如果一个网站被搜索引擎认为存在购买外链的行为,那么很可能就会遭受到搜索引擎的打击。

以上便是为大家介绍的绿萝算法,下面为大家讲解一下针对绿萝算法的建议:

1.外链建设要保持多元化,不能全部靠购买。

有了绿萝算法之后,链接也不是不能购买,只是不能全部为购买的,搜索引擎在计算是否为作弊的时候是综合考虑的,比如你有100个外链,其中有3个被判断为有作弊嫌疑,那么整体是不会受到影响的,但如果其中有90个被判断为有作弊嫌疑,那就很可能被认定为作弊了。

2.外链有规律地持续增加。

通常购买链接都是买一次全部加上了,这也可能成为搜索引擎判断是否作弊的线索。

正常的外链建设应该是有规律地持续增加,不能突然增加大量的链接后就没有变化了。

3.外链锚文本保持多元化。

正常的外链应该有多元化的锚文本,购买的外链锚文本更加单一。

所以我们在进行外链建设时切记不能使用单一的锚文本。

 

 

惊雷算法【SEO算法】

惊雷算法是百度推出的一种搜索引擎算法,旨在打击通过刷点击的方式操纵关键词在百度搜索中的排名。

以下是百度官方对惊雷算法的解释:

11月20日,搜索资源平台上线《百度搜索推出惊雷算法 严厉打击刷点击作弊行为》,主要打击通过刷点击,提升网站搜索排序的作弊行为。

关于惊雷算法,有以下要点解读:

1、惊雷算法严厉打击通过刷点击,提升网站搜索排序的作弊行为,同时综合考虑站点质量、历史数据等各纬度特征,针对作弊行为绝不姑息;

2、惊雷算法上线后,依靠刷点击提升搜索排名的效果将不再生效,以往刷点击行为将进行打压。

我们都知道,搜索引擎的根本目的是给用户提供符合其需求的信息,而用户对搜索结果的点击情况能反映出哪些信息是用户真正需要的,因此,搜索引擎会把用户对搜索结果的点击率计入到后续的排名运算中。

比如用户搜索“广州SEO”,点击率最高的是排名在第五位的网站,那么在其他因素不变的情况下,排名第五的网站会提升到前面。

很多SEOer就利用搜索引擎的这个特点来进行作弊,通过刷点击率的方式来提升关键词在搜索引擎的排名,而且在相当长的一段时间内,刷点击的方法非常好用,导致大家都不关心内容、链接这些,只要通过简答的刷点击操作就能获得很好的排名,这就违反了搜索引擎为用户提供优质内容的初衷,最终导致了百度出台了打击刷点击操纵排名的惊雷算法。

下面我们针对惊雷算法为大家做出一些分析:

问题1.惊雷算法出台后,是否点击率对网站排名结果没有任何影响了呢?

百度想大家那些通过刷点击操作来操纵排名的行为,但是并不想忽略掉真实用户点击行为对搜索结果的影响,毕竟用户的选择对搜索引擎来说是一种最有价值的投票形式。

并且,如果百度想忽略掉点击率对排名结果的任何影响,根本不需要出什么新的算法,只要去掉原先算法中对点击率的计算就行了,那样无论你点击率大还是小,都对结果没有任何影响。

问题2:惊雷算法可能计算的因素有哪些

1.域名年龄。

新域名刷点击被认为作弊的可能性更大,老域名相对更安全。因为老域名已经做了一段时间,如果被惩罚的话付出的成本相对较高,所以新域名作弊的可能性是更高一些的。

2.整体优化情况

网站整体优化情况好的,不容易被判定为作弊行为,而那些自身优化情况不太好的网站则更容易被判定为作弊。比如本身权重高、链接好、流量大的网站,是没那么容易被认定为作弊的。

所以,在做SEO时要注意整体的优化情况,切忌把单一的优化手段用到极致,这样是很可能被判为作弊的。

3.流量质量。

百度有可能通过自己获取的数据将一些IP列为作弊黑名单,如果你的搜索流量有很大比例上来自于IP黑名单,那么被认定为作弊的可能性就非常高了。

另外,如果你的网站使用了百度统计,那么百度还会获取你网站流量的详细数据,比如IPUV、停留时间等,那么百度就可以通过这些数据来判断你的网站流量的质量如何,是否存在机器刷点击的嫌疑。

通过作弊行为获得搜索流量,虽然看起来能够比较快速地实现目标,但是也很容易造成“Easy comeEasy go”的局面,长远来说,SEO优化还是要做到全面优化,在符合搜索引擎算法的基础上提升用户体验才是根本的SEO解决方案。

以上便是为大家介绍的百度的惊雷算法,以及我们对惊雷算法的一些解读,希望对大家进行SEO优化工作带来帮助。

 

搜索引擎判断文章是否为原创的3个依据丨广州SEO

搜索引擎是喜欢原创、高质量的内容的,那么,搜索引擎判断文章是否是原创的依据有哪些呢?下面为大家介绍一下搜索引擎判断文章是否为原创的几个依据,供大家在创作内容时进行参考。

搜索引擎判断原创内容依据一:被收录的时间

这点很容易理解,如果是相同的内容,那么被收录时间早的通常会被认为是原创内容。

所以,我们在自己网站发布的文章,最好等到收录后再发布到其他平台,如果同时把文章发布到自己网站以及第三方平台,那么很有可能是第三方平台先被收录,这样的话自己网站发布的文章反而会被认为不是原创文章了。

搜索引擎判断原创内容依据二:指纹算法

搜索引擎会根据一定的算法计算出在其他网站上是否已经存在相同的文章或者相似的文章,如果网站文章在其他网站已经存在(或相似),那么文章可能就不会被认为是原创文章,搜索引擎的这种识别文章内容的算法被称为指纹算法。

根据这个算法我们可以判断,一般的替换同义词、介词、副词,更换段落等简单的伪原创方法对搜索引擎已经不管用了。

搜索引擎判断原创内容依据三:文章中的链接地址

如果文章中添加了指向原文的地址,并且在被转载的过程中没有被去掉链接,那么搜索引擎就会根据链接来判断出原文发布地址,认为链接指向的页面为原文地址。

综上,搜索引擎判断文章是否为原创的3个依据主要就是文章收录时间、指纹算法以及链接分析技术。