百度站长平台介绍 百度站长平台常见问题解答

http://www.itjxue.com  2015-07-29 21:54  来源:未知  点击次数: 

百度站长平台介绍

百度站长平台是一个服务于百度网页收录的数据提交平台。通过本平台,您网站的有效数据将更容易、更快速、更全面的被百度网页收录。
在经过必要的申请、审核后,借助百度站长平台,您可以:
1. 大批量向百度推送您希望收录的数据;
2. 在一定程度上减轻抓取产生的额外负担;
3. 网页更容易被百度收录,新增和删除数据,更快被百度所知道;
4. 还可查看数据的详细统计等其它附加功能。
注:
百度对已提交的sitemap数据 ,不承诺即时收录、完全收录及url在网页搜索结果中的排序。

注册平台账号

平台首页提供了账号注册入口,需要按照注册页面的要求认真填写注册信息,即可拥有平台账号。
进入平台注册页面

如何获得邀请码

百度站长平台处于测试期中,尚不对外开放。测试用户将由百度发放邀请码注册。因此您需要获得邀请码,才能注册账号。
您可以通过邮件联系我们,以获得邀请码,点此 联系我们联系我们

邮件标题中,请写明[百度站长平台]字样。

数据提交流程

第一步:提交网站信息,验证网站归属,等待审核。

·输入网站地址并点击“添加新网站”。若网站删除或更换域名,则需重新提交。
·点击“现在就去验证”,获取验证文件并提交。如右图所示。
·验证通过,等待管理员审核。审核内容主要包括网站属性、网站内容质量等。审核最长可能需要一天时间。

第二步:审核通过,点击“sitemap管理”,提交数据。
您提交的数据分为sitemap和删除文件两种。Sitemap指您想要被百度收录的数据,删除文件指您想要被百度删除的数据(包括死链列表等)。

·如果您是首次提交,输入sitemap地址,在下拉菜单选择“sitemap”,点击“提交”即可。提交该网站其它sitemap时,重复本步骤即可。
·如果您想提交删除文件(包括死链列表),输入删除文件地址,在下拉菜单选择“删除文件”,点击“提交”即可。
·如果您想更新已提交的sitemap数据,选中文件并点击“更新选中文件”即可,无需再次提交。
·平台会对sitemap进行处理,如果数据存在错误或不符合协议格式,则数据会被置为错误状态,可参考平台提示修改并更新。

·sitemap数据提交后,一般在1小时内会被百度处理。处理时间视文件大小而定。
·您可通过平台查看数据的统计信息,包括已抓取数量,最新抓取时间等。
注:
百度对已提交的sitemap数据 ,不承诺即时收录、完全收录及url在网页搜索结果中的排序。

百度sitemap协议

百度sitemap协议是百度支持的网页收录标准,站长可以将网站中的网页url制作成标准的sitemap文件,用于指引百度搜索引擎快速、全面的抓取或更新网站上内容及处理错误信息。

百度sitemap支持标准的XML格式sietmap文件以及文本格式的sitemap文件,如果您有多个sitemap文件,还可以使用sitemap索引文件提交。
Sitemaps 协议格式由 XML 标记组成。Sitemap 的所有数据数值应为转义过的。文件本身应为 UTF-8 编码。

Sitemap 索引文件必须:

  • <sitemapindex> 开始标记作为开始,以 </sitemapindex> 结束标记作为结束。
  • 每个 Sitemap 包含一个<sitemap> 条目作为 XML 父标记。
  • 每个 <sitemap> 父标记包含一个 <loc> 子标记条目。

XML格式举例:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
     <url>
       <loc>http://www.example.com/</loc>
       <lastmod>2009-01-01</lastmod>
       <changefreq>always</changefreq>
       <priority>1.0</priority>
     </url>
</urlset>

XML标签说明:

属性 是否必填项 说明
<urlset> 必填 声明支持的协议。
<url> 必填 每个网址记录的父标记。
<loc> 必填 该页的网址。该值必须少于256个字符。
<lastmod> 可选 该文件上次修改的日期。
<changefreq> 可选 页面可能发生更改的频率。有效值为:
  • always
  • hourly
  • daily
  • weekly
  • mothly
  • yearly
  • never
<priority> 可选 此网页的优先级。有效值范围从 0.0 到 1.0。

转义字符说明:

XML标签内容中的一些特殊字符需要转换为XML定义的转义字符,否则将发生错误,转义字符中的"&"无需再转,具体参见下表。

字符 转义后的字符
和(and) & &amp;
单引号 ' &apos;
双引号 " &quot;
大于号 > &gt;
小于号 < &lt;

 

文本格式sitemap说明:

您可以提供纯文本文件,其中每行包含一个网址。此文本文件需要遵循以下指南:

  • 文本文件每行都必须有一个网址。网址中不能有换行。
  • 您必须指定完整的网址,包括 http。
  • 每个文本文件最多可包含 50,000 个网址,并且不得超过 10MB(10,485,760 字节)。如果网站所包含的网址超过 50,000 个,则可将列表分割成多个文本文件,然后分别添加每个文件。
  • 文本文件需使用 UTF-8 编码。
  • 文本文件不应包含网址列表以外的任何信息。

文本文件的示例条目如下所示:
http://www.example.com/catalog?item=1
http://www.example.com/catalog?item=11

使用sitemap索引文件(对多个sitemap文件)说明:

您可以提供多个 Sitemap 文件,但每个 Sitemap 文件包含的网址不得超过 50,000 个,并且文件不得超过 10MB(10,485,760 字节)。如果您愿意,可以使用 gzip 压缩 Sitemap 文件,以减少带宽要求;但是解压缩后的 Sitemap 文件不得超过 10MB。如果要列出 50,000 个以上的网址,您需要创建多个 Sitemap 文件。

Sitemap 索引文件必须: Sitemap 索引文件必须:

  • <sitemapindex> 开始标记作为开始,以 </sitemapindex> 结束标记作为结束。
  • 每个 Sitemap 包含一个<sitemap> 条目作为 XML 父标记。
  • 每个 <sitemap> 父标记包含一个 <loc> 子标记条目。

sitemap索引文件标签说明:

属性 是否必填项 说明
<sitemapindex> 必填 压缩文件中所有sitemap的相关信息
<sitemap> 必填 压缩文件中个别sitemap的相关信息
<loc> 必填

识别sitemap的位置

<lastmod> 可选

识别相对sitemap文件的修改时间

sitemap协议类型及包含范围

  • 百度sitemap协议支持提交收录网页列表以及死链列表。

    收录网页列表用于指引百度搜索引擎快速、全面的抓取网站上内容。您可以使用XML格式、文本格式以及sitemap索引文件提交。
    死链列表用于提交您网站上被删除或者权限发生变动的网页列表,指引百度搜索引擎快速屏蔽这些网页。
    死链列表目前只能使用文本格式在百度站长平台提交。

  • sitemap文件的包含范围以主域为单位。

    如果您验证了http://www.example.com/这个网站,那么sitemap文件中可以包含http://www.example.com/、http://example.com/、http://bbs.example.com/等所有example.com主域下站点中的网址。

  • 常见问题

    1. sitemap都支持哪些格式?
      支持XML格式和TXT文本格式。
    2. 我可以提交多少个sitemap数据?提交的sitemap会都被百度收录吗?
      平台对于提交sitemap的数量没有限制。每个sitemap文件最多可包含 50,000 个网址,并且不得超过 10MB(10,485,760 字节)。
      您提交的sitemap或sitemap文件中的所有URL不一定完全被收录,百度会根据数据的具体情况来判别。
    3. sitemap提交后,多久能被百度抓取?
      sitemap数据提交后,一般在1小时内会被百度处理。处理完成的时间视文件大小而定。
    4. sitemap提交后,还需要大量的人力进行维护吗?
      不需要,您可以根据具体情况进行定期维护。
    5. 应该将 Sitemap 文件放在哪里?
      建议将 Sitemap 放在 HTML 服务器的根目录中,即 http://www.example.com/sitemap.xml。
      某些情况下,例如您公司网站允许对应不同的目录划分写入权限,这时您或许希望在网站上针对不同的路径创建不同的 Sitemap。
      如果您有上传到 “http://www.example.com/路径/sitemap.xml” 的权限,那么您可以针对 “http://www.example.com/路径/” 创建不同的sitemap 。

      Sitemap 包含的所有网址必须和 Sitemap 位于同一个主机上。
      例如,
      如果 Sitemap 位于 http://www.example.com/sitemap.xml,就不能包含 http://xxx.example.com 中的网址。
      如果 Sitemap 位于 http://www.example.com/路径/sitemap.xml,就不能包含 http://www.example.com 中的网址。
    6. 我的 Sitemap 可以有多大?
      单个Sitemap 不得超过 10MB(10,485,760 字节),所包含的网址数最多为 50,000 个。
      如果您网站包含的网址超过 50,000 个或您的 Sitemap 超过 10MB,则需要创建多个 Sitemap 文件,并且需要使用 Sitemap 索引文件。
      Sitemap 索引文件不得超过10mb,且最多可以包含1000个sitemap。
    7. 我的网站拥有几千万个网址;我可以只提交最近更改过的网址吗?
      您可以在少数频繁更改的 Sitemap 中列出已更新的网址,然后使用 Sitemap 索引文件中的 lastmod 标记识别这些 Sitemap 文件。
      随后,百度即可逐步抓取这些已更改的 Sitemap。
    8. Sitemap 中的网址需要完整地指定吗?
      是的。您需要在网址中提供协议。例如,http://www.example.com/ 对 Sitemap 来说是有效网址,而 www.example.com 则不是。
    9. 我的网站同时具有“http”和“https”格式的网址。需要把它们都列出来吗?
      请在 Sitemap 中只列出一种格式的网址。包含多种格式的网址可能会导致抓取工具无法完整地抓取网站。
    10. 网址在 Sitemap 中的位置是否会影响它的使用?
      不会。网址在 Sitemap 中的位置并不会影响百度对它的识别或使用方式。
    11. 我可以压缩我的 Sitemap 吗?它们是否需要用 gzip 压缩?
      可以。请使用 gzip 压缩 Sitemap。无论压缩与否,Sitemap 均不得超过 10MB(10,485,760 字节)。
    12. XML格式的 Sitemap 中,“priority”提示会影响我的网页在搜索结果中的排名吗?
      不会。Sitemap 中的“priority”提示只是说明该网址相对于您自己网站上其他网址的重要性,并不会影响网页在搜索结果中的排名。
    13. 如果我在使用协议或提交 Sitemap 时遇到其他问题怎么办?
      如果您在使用协议时还有问题,可以参考sitemaps.org的详细说明 。
      如果还有问题,可以邮件联系我们。

    (责任编辑:IT教学网)

    更多