内容作弊的目的是通过精心更改或者调控网页内容,使得网页在搜索引擎排名中获得与其网页不相称的排名。搜索引擎排名算法一般包括内容相似性计算和链接重要性计算,内容作弊就是通过提高内容相似性计算的得分而获得最终的高排名。其实质是故意加大目标词的词频。常见的内容作弊方式有以下几种:
1、
关键词重复
对于作弊者关心的目标关键词,大量重复设置在页面内容中。因为词频是搜索引擎相似度计算中必然会考虑的因子,关键词重复本质上是通过提高目标关键词的词频来影响搜索引擎内容相似性排名的。
2、
无关查询词作弊
为了能够尽可能多地吸引搜索流量,作弊者在页面内容中增加很多和页面主题无关的关键词,这本质上也是一种词频作弊,即将原来词频为0的关键词提升为非0.
3、
图片alt标签文本作弊
alt标签原本是作为图片的描述信息来使用的,一般不会在HTML页面显示,除非用户将鼠标放在图片上。但是搜索引擎会利用这个信息,所以有些作弊者将alt标签的内容以作弊的词汇来填充,达到吸引更多搜索流量的目的。
4、
网页标题作弊
网页标题作为描述网页内容的综述性信息,对于判断一个网页所讲述的主题是非常重要的启发因素,所以搜索引擎在计算相似性得分时,往往会增加标题词的权重。作弊者利用这一点,将与网页主题无关的目标词重复放在标题位置来获得较高的排名。
5、
网页重要标签作弊
网页不像普通文本格式,是带有HTML标签的,而有些标签代表了强调内容重要性意义,比如加粗<b></b>标记,段落<p></p>
6、内容农杨
1、利用API和RSS等手段方法,对其他人的博客内容进行采集后产生的放置于自己网站或博客中的内容;
2、使用段落拼接的方式,将关键词和正常文章(多以小说为主)截取片段,组成的毫无实际意义的文章;
3、采用工具自动批量产生的大量质量差、重复性强的信息内容;
4、简单复制别人的原创内容到自己的网站或博客中。
百度对作弊的判定条件在网页源代码中任何位置,故意加入与网页内容不相关的关键词。
在网页源代码中任何位置,故意大量重复某些关键词。即使与网页内容相关的关键词,故意重复也被视为作弊行为。
在网页中加入搜索引擎可识别但用户看不见的隐藏文字。无论是使用同背景色文字、 超小字号文字、文字隐藏层、还是滥用图片ALT 等方法,都属于作弊行为。
故意制造大量链接指向某一网址的行为。
对同一个网址,让搜索引擎与用户访问到不同内容的网页(包括利用重定向等行为)。
作弊行为的定义是针对网站而不是网页的。一个网站内即使只有一个网页作弊,该 网站也被认为是有作弊行为。
有链接指向作弊网站的网站,负连带责任,也会被认为是作弊(但是,作弊网站上 链接指向的网站,不算作弊)。
谷歌 对作弊的判定条件
使用隐藏文本或隐藏链接。
采用隐藏真实内容或欺骗性重定向手段。
向 谷歌发送自动查询。
使用无关用语加载网页。
创建包含大量重复内容的多个网页、子域或域。
创建安装病毒 (如,特洛伊木马)或其他有害软件的网页。
采用专门针对搜索引擎制作的“桥页”,或采用如联属计划这类原创内容很少或几乎没有原创内容的“俗套”(cookie cutter) 方式。
欢迎分享,转载请注明来源:夏雨云
评论列表(0条)