搜索引擎有效删除有害网页内容的探究

http://www.itjxue.com  2015-08-02 11:19  来源:未知  点击次数: 

绝大多数的网络行销商对使用主流搜索引擎很感兴趣,这些搜索引擎主要是谷歌、雅虎以及MSN.但是,在什么时候特别的环境碰撞,一个网页或是两个网页,或者是2000个网页偶然地进入搜索引擎索引?你不需要的有害网页,不是由搜索引擎获得,绝大部分也能被公开看到。

  你如何快速而永久地把一些有害内容从搜索引擎中消除?你是否向谷歌发传真,向雅虎打电话,或是给微软的鲍尔默发邮件?你可以通过上述不同的方式,我敢肯定你最后是无果而终。

  绝大多数的网络行销商会向公司的IT团队发出指令,要求他们把网页从网站上删除。逻辑很简单:从网站上删除意味着你不再考虑这一个问题了。然后,你就充满胜利感称赞IT团队,向你的才板电邮告知,称"故障已排除".

  这样做,是远远不够的。

  网络行销商需要知道更多的知道,明白如何从搜索引擎中消除不需要的网页。简单地删除源代码并不起作用。谷歌和MSN的搜索引擎在能更快、更好地消除网络错误,当然,会存在缓冲内容。当你计算删除链接时,从搜索引擎结果中获得网页可能会是一个巨大的挑战。

  但是,只要你今天采取有效的方法,就可以避免今后出现失误。

  第一,要确信你的网站出现了404错误。当网页不存在时,它会向用户发出相关错误信息。如果你的网站主页是默认设置,当用户输入URL时,搜索引擎就会认为网页仍然存在。于是,搜索引擎就没有理由把网页从索引中删除。这些"死亡"的网页看起来仍活着。

  不要让错误的网页毁了一个完美的网站。把你的404错误进行排序,然后采取下一步措施,向搜索引擎证明你拥有并管理网站。通过使用谷歌和雅虎网络管理工具,验证你的网站证明你的合法存在。这样作,可以帮助你很容易地删除不合适的URL.

  如果你仍未对网站的真实性进行验证,就要以最快的速度删除流氓网页。如果你已通过谷歌网络管理工具或雅虎网站浏览器对网站进行了验证,则你离永久删除流氓内容已非常接近了。

  比如,注册雅虎网站浏览器,输入URL,点击删除按钮,删除每个想删除的网页。但是,你要注意 ,当URL以这种方式被删除时,雅虎会删除特定URL,以及在URL中的子路径。因此,删除时一定要小心谨慎。

  雅虎网站浏览器有作用,这是因为在确认过程中它一直显示所有的URL子路径。你会看到在"行动"信息中出现"未删除"状态,因此你需要知道何是URL被有效地删除。通常,雅虎在48个小时内会对用户请求做出小心谨慎的处理。当你有需要时,你可以设置雅虎网站浏览器参数,这样就能接收到电邮提示。

  当你在谷歌Webmaster Central中对你的网站进行了身份确认后,通过谷歌工具删除网页也是同样的方式的步骤。

  当然,你首先可以使用robots.txt协议把你的内容从搜索引擎中删除。这种方法有助于把新的或是不受欢迎的内容从索引中删除。尽管这需要时间,需要搜索引擎重新调整内容,反映你的网站所删除的内容。花多长时间从搜索引擎中删除不需要内容,这也反映了你的网站的整体搜索性能。

  要记住,使用robots.txt协议拒绝搜索引擎接入你网站内合法便不需要索引的URL,但它无法使URL置身于外。这是因为,搜索引擎试图发现拒绝URL的参数,诸如内部导航链接等。

  即便这不是一种快速从搜索引擎中删除网页的好办法,目前采用robots.txt协议仍是从MSN搜索引擎中删除不需要URL的唯一办法。不幸的是,这需要搜索引擎花多个星期完成索引升级。

  MSN也建议增加为不需要的索引内容增加a >noindexmeta< tag,在HTTPS中删除URL,以确保安全。但是,这种方法不总是一直有效。它只是对预防性维护有作用。如果你对快速删除网页很关注,则直接接入MSN搜索网站用户支持。当然,你可能要待数星期才能得到回复。

  如果你现在花一些时间,今后就会避免数据灾难出现。检查一下你的404错误,了解你的robots.txt文件,熟悉在Meta标签中使用bot信息,并在谷歌和雅虎工具或者是MSN工具中对网站进行验证。当发生不测时,你就能有效地保护隐私。防患于未然,这是一种明智选择,特别是你的网站或是品牌名声受到了博客等对手挑战时,这种做法更显得弥足珍贵。

(责任编辑:IT教学网)

更多