百度内容原创星火计划:网站的原创内容
站长大会上百度说要大力提倡原创,准备上线星火计划,近期又专门在站长平台上平台发布文章再次提到原创问题。似乎百度越来越重视用户体验,越来越让中小站长看到希望,以为好好做站,老老实实原创就很快会得到百度重视。我只想说,原创?从来都不是百度的重点!那只是百度对站长许下的美丽承诺。
很多人可能要反驳我,而且会驳得我哑口无言。好吧,仁者见仁智者见智!先简单来看一看百度发表的《谈谈原创项目那点事》http://zhanzhang.baidu.com/wiki/172这篇文章,或许我的解读跟大家不一样。百度的原文我摘录部分如下(欲了解详细内容可自行去百度站长平台查看):
一、搜索引擎为什么要重视原创
1.1 采集泛滥化
1.2 提高搜索用户体验
1.3 鼓励原创作者和文章
二、采集很狡诈,识别原创很艰难
三、百度识别原创之路如何走?
3.1 成立原创项目组,打持久战
面对挑战,为了提高搜索引擎用户体验、为了使优质原创者原创网站得到应有的收益、为了推动中文互联网的前进,我们抽调大量人员组成原创项目组:技术、产品、运营、法务等等,这不是临时组织不是1个月2个月的项目,我们做好了打持久战的准备。
3.2 原创识别“起源”算法
互联网动辄上百亿、上千亿的网页,从中挖掘原创内容,可以说是大海捞针,千头万绪。我们的原创识别系统,在百度大数据的云计算平台上开展,能够快速实现对全部中文互联网网页的重复聚合和链接指向关系分析。首先,通过内容相似程度来聚合采集和原创,将相似网页聚合在一起作为原创识别的候选集合;其次,对原创候选集合,通过作者、发布时间、链接指向、用户评论、作者和站点的历史原创情况、转发轨迹等上百种因素来识别判断出原创网页;最后,通过价值分析系统判断该原创内容的价值高低进而适当的指导最终排序。
目前,通过我们的实验以及真实线上数据,“起源”算法已经取得了一定的进展,在新闻、资讯等领域解决了绝大部分问题。当然,其他领域还有更多的原创问题等待“起源”去解决,我们坚定的走着。
3.3 原创星火计划
我们一直致力于原创内容的识别和排序算法调整,但在当前互联网环境下,快速识别原创解决原创问题确实面临着很大的挑战,计算数据规模庞大,面对的采集方式层出不穷,不同站点的建站方式和模版差异巨大,内容提取复杂等等问题。这些因素都会影响原创算法识别,甚至导致判断出错。
第一点百度为何要重视“原创”?按照百度说法是由于大量采集、伪原创伤害用户体验,再加上百度鼓励原创。看似很符合逻辑,实则禁不起推敲,我不仅要问采集、伪原创伤害了用户体验,这跟百度竞价被诟病一直存在欺诈钓鱼站,只要花钱就可以推广从而让很多人上当受骗,哪个更伤害用户体验?百度鼓励原创这种说法更不靠谱,既然鼓励原创,早干嘛去了,现在才跑来说要鼓励原创,这么多年都在干吗?
最近看了《中国合伙人》,里边有句台词说的好:听一个人说话,不是听他说了什么,而是听他没说什么。首先我们来看,百度是一家商业公司,既然是商业公司,在天朝这种神奇的国度,从来都是利益才是第一位的。在中国互联网的网站中对百度贡献最大的是企业网站以及企业制作的盈利网站,这类网站最直接的就是通过百度竞价及百度联盟等形式来宣传推广。
而很大一部分中小企业网站根本无法原创,最多也只是伪原创,尤其是医疗行业和电商行业,医疗行业的病种也就来来回回几类,很难源源不断的进行原创更新,而电商行业的产品更是如此,即使上线新产品,但是介绍和信息也都是大致相同。企业也没有时间和精力去一一原创。如果百度针对原创进行打击,从而对这种没有原创网站降权,那么很大一批网站将不会有很好的权重,从而在自然推广得到的利益就很少,在百度关键词排名竞争中也就处于劣势。相反则会更加依赖百度的竞价系统来实现宣传推广。
第二点百度说识别原创很难,而且要走很长时间的路。到底有多难?百度没有表达。要走多久?百度只是说是一个持久战。这种文字表达游戏和语言组织能力,是我天朝特有的形式,为何现在很多民众不再相信官方发言,为何对外那个部门的讲话被称为玩文字游戏,这都是中国几千年来智慧的结晶(有点敏感,大家自行屏蔽)。
其实,我要说的是,百度在说了重视原创之后又说识别原创很难,这到底是个什么意思?这是先给大部分没有原创网站一个警告:我要打击伪原创,你们马上要倒霉了。而拥有原创的大多是个人站长,满心希望以为终于看到了曙光的时候,这时百度又说了,现阶段还无法有效识别原创,你再等等吧!相当于一张空头支票。
所以,广大站长你还在很傻很天真的以为百度真的是为了用户体验,真的是为了要鼓励你原创,真的是要给你的网站提升权重吗?快醒醒吧,那只是百度的一张画饼。
我并非是对百度报以敌意,相反,百度的这种做法在一定程度上促进了互联网的一种健康环境,一系列的算法更是净化了互联网的一种氛围,无论是seo还是网站营销手段都起到一个合理规范引导作用。但是所有的前提是百度是一家商业化公司,别想得太好,也别想得太坏!百度也没有义务担负起中国互联网的道德模范,因为盈利才是最终目的。