百度站长平台介绍 百度站长平台常见问题解答
百度站长平台介绍
百度站长平台是一个服务于百度网页收录的数据提交平台。通过本平台,您网站的有效数据将更容易、更快速、更全面的被百度网页收录。
在经过必要的申请、审核后,借助百度站长平台,您可以:
1. 大批量向百度推送您希望收录的数据;
2. 在一定程度上减轻抓取产生的额外负担;
3. 网页更容易被百度收录,新增和删除数据,更快被百度所知道;
4. 还可查看数据的详细统计等其它附加功能。
注:
百度对已提交的sitemap数据 ,不承诺即时收录、完全收录及url在网页搜索结果中的排序。
注册平台账号
平台首页提供了账号注册入口,需要按照注册页面的要求认真填写注册信息,即可拥有平台账号。
进入平台注册页面
如何获得邀请码
百度站长平台处于测试期中,尚不对外开放。测试用户将由百度发放邀请码注册。因此您需要获得邀请码,才能注册账号。
您可以通过邮件联系我们,以获得邀请码,点此 联系我们联系我们
邮件标题中,请写明[百度站长平台]字样。
数据提交流程
第一步:提交网站信息,验证网站归属,等待审核。
·输入网站地址并点击“添加新网站”。若网站删除或更换域名,则需重新提交。
·点击“现在就去验证”,获取验证文件并提交。如右图所示。
·验证通过,等待管理员审核。审核内容主要包括网站属性、网站内容质量等。审核最长可能需要一天时间。
第二步:审核通过,点击“sitemap管理”,提交数据。
您提交的数据分为sitemap和删除文件两种。Sitemap指您想要被百度收录的数据,删除文件指您想要被百度删除的数据(包括死链列表等)。
·如果您是首次提交,输入sitemap地址,在下拉菜单选择“sitemap”,点击“提交”即可。提交该网站其它sitemap时,重复本步骤即可。
·如果您想提交删除文件(包括死链列表),输入删除文件地址,在下拉菜单选择“删除文件”,点击“提交”即可。
·如果您想更新已提交的sitemap数据,选中文件并点击“更新选中文件”即可,无需再次提交。
·平台会对sitemap进行处理,如果数据存在错误或不符合协议格式,则数据会被置为错误状态,可参考平台提示修改并更新。
·sitemap数据提交后,一般在1小时内会被百度处理。处理时间视文件大小而定。
·您可通过平台查看数据的统计信息,包括已抓取数量,最新抓取时间等。
注:
百度对已提交的sitemap数据 ,不承诺即时收录、完全收录及url在网页搜索结果中的排序。
百度sitemap协议
百度sitemap协议是百度支持的网页收录标准,站长可以将网站中的网页url制作成标准的sitemap文件,用于指引百度搜索引擎快速、全面的抓取或更新网站上内容及处理错误信息。
百度sitemap支持标准的XML格式sietmap文件以及文本格式的sitemap文件,如果您有多个sitemap文件,还可以使用sitemap索引文件提交。
Sitemaps 协议格式由 XML 标记组成。Sitemap 的所有数据数值应为转义过的。文件本身应为 UTF-8 编码。
Sitemap 索引文件必须:
- 以 <sitemapindex> 开始标记作为开始,以 </sitemapindex> 结束标记作为结束。
- 每个 Sitemap 包含一个<sitemap> 条目作为 XML 父标记。
- 每个 <sitemap> 父标记包含一个 <loc> 子标记条目。
XML格式举例:
<?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>http://www.example.com/</loc> <lastmod>2009-01-01</lastmod> <changefreq>always</changefreq> <priority>1.0</priority> </url> </urlset>
XML标签说明:
属性 | 是否必填项 | 说明 |
---|---|---|
<urlset> | 必填 | 声明支持的协议。 |
<url> | 必填 | 每个网址记录的父标记。 |
<loc> | 必填 | 该页的网址。该值必须少于256个字符。 |
<lastmod> | 可选 | 该文件上次修改的日期。 |
<changefreq> | 可选 | 页面可能发生更改的频率。有效值为:
|
<priority> | 可选 | 此网页的优先级。有效值范围从 0.0 到 1.0。 |
转义字符说明:
XML标签内容中的一些特殊字符需要转换为XML定义的转义字符,否则将发生错误,转义字符中的"&"无需再转,具体参见下表。
字符 | 转义后的字符 | |
和(and) | & | & |
单引号 | ' | ' |
双引号 | " | " |
大于号 | > | > |
小于号 | < | < |
文本格式sitemap说明:
您可以提供纯文本文件,其中每行包含一个网址。此文本文件需要遵循以下指南:
- 文本文件每行都必须有一个网址。网址中不能有换行。
- 您必须指定完整的网址,包括 http。
- 每个文本文件最多可包含 50,000 个网址,并且不得超过 10MB(10,485,760 字节)。如果网站所包含的网址超过 50,000 个,则可将列表分割成多个文本文件,然后分别添加每个文件。
- 文本文件需使用 UTF-8 编码。
- 文本文件不应包含网址列表以外的任何信息。
文本文件的示例条目如下所示:
http://www.example.com/catalog?item=1
http://www.example.com/catalog?item=11
使用sitemap索引文件(对多个sitemap文件)说明:
您可以提供多个 Sitemap 文件,但每个 Sitemap 文件包含的网址不得超过 50,000 个,并且文件不得超过 10MB(10,485,760 字节)。如果您愿意,可以使用 gzip 压缩 Sitemap 文件,以减少带宽要求;但是解压缩后的 Sitemap 文件不得超过 10MB。如果要列出 50,000 个以上的网址,您需要创建多个 Sitemap 文件。
Sitemap 索引文件必须: Sitemap 索引文件必须:
- 以 <sitemapindex> 开始标记作为开始,以 </sitemapindex> 结束标记作为结束。
- 每个 Sitemap 包含一个<sitemap> 条目作为 XML 父标记。
- 每个 <sitemap> 父标记包含一个 <loc> 子标记条目。
sitemap索引文件标签说明:
属性 | 是否必填项 | 说明 |
---|---|---|
<sitemapindex> | 必填 | 压缩文件中所有sitemap的相关信息 |
<sitemap> | 必填 | 压缩文件中个别sitemap的相关信息 |
<loc> | 必填 |
识别sitemap的位置 |
<lastmod> | 可选 |
识别相对sitemap文件的修改时间 |
sitemap协议类型及包含范围
收录网页列表用于指引百度搜索引擎快速、全面的抓取网站上内容。您可以使用XML格式、文本格式以及sitemap索引文件提交。
死链列表用于提交您网站上被删除或者权限发生变动的网页列表,指引百度搜索引擎快速屏蔽这些网页。
死链列表目前只能使用文本格式在百度站长平台提交。
如果您验证了http://www.example.com/这个网站,那么sitemap文件中可以包含http://www.example.com/、http://example.com/、http://bbs.example.com/等所有example.com主域下站点中的网址。
常见问题
- sitemap都支持哪些格式?
支持XML格式和TXT文本格式。 - 我可以提交多少个sitemap数据?提交的sitemap会都被百度收录吗?
平台对于提交sitemap的数量没有限制。每个sitemap文件最多可包含 50,000 个网址,并且不得超过 10MB(10,485,760 字节)。
您提交的sitemap或sitemap文件中的所有URL不一定完全被收录,百度会根据数据的具体情况来判别。 - sitemap提交后,多久能被百度抓取?
sitemap数据提交后,一般在1小时内会被百度处理。处理完成的时间视文件大小而定。 - sitemap提交后,还需要大量的人力进行维护吗?
不需要,您可以根据具体情况进行定期维护。 - 应该将 Sitemap 文件放在哪里?
建议将 Sitemap 放在 HTML 服务器的根目录中,即 http://www.example.com/sitemap.xml。
某些情况下,例如您公司网站允许对应不同的目录划分写入权限,这时您或许希望在网站上针对不同的路径创建不同的 Sitemap。
如果您有上传到 “http://www.example.com/路径/sitemap.xml” 的权限,那么您可以针对 “http://www.example.com/路径/” 创建不同的sitemap 。
Sitemap 包含的所有网址必须和 Sitemap 位于同一个主机上。
例如,
如果 Sitemap 位于 http://www.example.com/sitemap.xml,就不能包含 http://xxx.example.com 中的网址。
如果 Sitemap 位于 http://www.example.com/路径/sitemap.xml,就不能包含 http://www.example.com 中的网址。 - 我的 Sitemap 可以有多大?
单个Sitemap 不得超过 10MB(10,485,760 字节),所包含的网址数最多为 50,000 个。
如果您网站包含的网址超过 50,000 个或您的 Sitemap 超过 10MB,则需要创建多个 Sitemap 文件,并且需要使用 Sitemap 索引文件。
Sitemap 索引文件不得超过10mb,且最多可以包含1000个sitemap。 - 我的网站拥有几千万个网址;我可以只提交最近更改过的网址吗?
您可以在少数频繁更改的 Sitemap 中列出已更新的网址,然后使用 Sitemap 索引文件中的 lastmod 标记识别这些 Sitemap 文件。
随后,百度即可逐步抓取这些已更改的 Sitemap。 - Sitemap 中的网址需要完整地指定吗?
是的。您需要在网址中提供协议。例如,http://www.example.com/ 对 Sitemap 来说是有效网址,而 www.example.com 则不是。 - 我的网站同时具有“http”和“https”格式的网址。需要把它们都列出来吗?
请在 Sitemap 中只列出一种格式的网址。包含多种格式的网址可能会导致抓取工具无法完整地抓取网站。 - 网址在 Sitemap 中的位置是否会影响它的使用?
不会。网址在 Sitemap 中的位置并不会影响百度对它的识别或使用方式。 - 我可以压缩我的 Sitemap 吗?它们是否需要用 gzip 压缩?
可以。请使用 gzip 压缩 Sitemap。无论压缩与否,Sitemap 均不得超过 10MB(10,485,760 字节)。 - XML格式的 Sitemap 中,“priority”提示会影响我的网页在搜索结果中的排名吗?
不会。Sitemap 中的“priority”提示只是说明该网址相对于您自己网站上其他网址的重要性,并不会影响网页在搜索结果中的排名。 - 如果我在使用协议或提交 Sitemap 时遇到其他问题怎么办?
如果您在使用协议时还有问题,可以参考sitemaps.org的详细说明 。
如果还有问题,可以邮件联系我们。