百度搜索反作弊团队:打击采集网站和冒充官网
百度网页搜索反作弊团队今日发表公告称,为了提高用户体验、清除低质采集的垃圾内容,百度将在6月底反作弊算法的基础上再度升级,并打击胡乱采集、超链接作弊、堆积关键词、冒充官网等严重影响用户体验的网站。
百度方面介绍称,此次算法升级,是百度在6月底反作弊算法的基础上,再一次清除内容质量低、用户体验差的网站。百度强调,百度算法的每次调整,都致力于提升用户的搜索体验,维护互联网生态的公平健康发展。百度公告表示,此次本次算法更新将使4%~5%的关键词的搜索体验有所改善,算法准确率达到了相当高的程度,但仍不排除出现个别误伤的情况,如果用户确信自己的站点被错误处理,可通过http://tousu.baidu.com/webmaster/suggest渠道进行反馈。
据悉,本次算法升级前,百度通过站长平台发布官方公告,举例说明此次算法升级所打击的五种影响用户体验的行为。而百度也表示,在今后每次重要升级前,都将会发布公告。
此前,百度曾在6月底进行算法升级,对大量低质量、无内容的站点进行清除。据超级监控对当时582840个网站的抽样数据显示,有80.80%的网站收录数据发生大更新,其中11.98%的网站收录呈现上升趋势,68.82%的网站收录呈现下降趋势,而K站比例约占0.96%。
百度网页搜索反作弊团队公告如下:
尊敬的各位用户,亲爱的站长们,大家好。
从上次6月底我们更新了反作弊算法以来,取得了不错的效果,搜索结果中的部分低质内容被清除,总体来看优质站点获得了更多的流量。但我们的算法升级并没有结束,最近我们在之前基础上增加了更多特征,将进一步降低低质结果在搜索中的展现。目的依然是使优质结果、原创网站得到更多的展现,从而提高用户的搜索体验,维护互联网生态的公平健康发展。本次百度系统算法升级,打击的主要为胡乱采集、超链作弊等影响用户体验的网站,举例如下:
1、乱采集内容,语句不通,读者无法从中获得需要的信息
2、内容虽然可读,但是绝大部分文章是采集、复制自其他网站,本身没有原创内容。
3、网页中穿插堆积关键词或文章与主题不相关,企图欺骗搜索引擎,对搜索相关关键词的用户没有实质的帮助
4、冒充官网欺骗用户,在title和meta标签中声明不真实
5、网站有大量违法或欺诈内容,可能造成用户财产安全损失
根据我们的评估,本次算法更新将使4%~5%的关键词的搜索体验有所改善,算法准确率达到了相当高的程度,但仍不排除出现个别误伤的情况,如果您确信自己的站点被错误处理,请通过http://tousu.baidu.com/webmaster/suggest渠道进行反馈。虽然我们无法对反馈一一进行回复,但对于每一个线上反馈,都会认真仔细的分析,并将分析结果体现到下一次升级中。
另外,我们会继续针对作弊行为的算法升级,例如对超链作弊进行更进一步的识别处理等。同时,坚持不懈的为用户提供优质原创内容的网站,也将进一步得到新算法的青睐。
百度网页搜索反作弊团队2012年8月22日星期三