隐藏

百度搜索资源平台解读与使用

发布:2022/9/19 14:25:44作者:管理员 来源:本站 浏览次数:3574

百度搜索资源平台是每个站长都会用到的一个工具,他是百度搜索面向B端开发者提供的资源提交、流量管理的官方平台。


平台包括资源提交、数据统计、搜索展现和站点优化与维护四部分。


一、数据提交


1、普通收录


(1)普通收录工具是站长向百度搜索提交资源的重要方式之一,它为开发者提供了API提交、sitemap提交、手动提交三种资源提交方式,开发者可以结合自身需求选择合适的方式进行提交。


(2)API推送:最为快速的提交方式,建议您将站点当天新产出链接立即通过此方式推送给百度,以保证新链接可以及时被百度收录。


sitemap:您可以定期将网站链接放到sitemap中,然后将sitemap提交给百度。百度会周期性的抓取检查您提交的sitemap,对其中的链接进行处理,但收录速度慢于API推送。


(3)手动提交:如果您不想通过程序提交,那么可以采用此种方式,手动将链接提交给百度。


(4)注意事项:


如链接存在跳转关系,直接提交跳转后的链接;


如网站更换了域名,需要提交新的域名资源。


(5)最新变化:


为了提升站点提交的优质资源的处理效率,搜索资源平台上线了配额机制,对平台工具的sitemap文件提交配额进行限制,包括“资源提交-普通收录-sitemap提交”和“链接提交-死链提交”。平台将基于站点资源质量和搜索用户喜欢程度综合评估计算站点提交配额,站点不同,提交配额也可能不同。


索引型sitemap文件不予处理,且若存在索引型sitemap,将不允许提交新文件,需删除索引型sitemap后再尝试提交数据。


(6)数据反馈:显示当天通过不同提交方式提交成功的去重后的链接数量。


2、快速收录


策略自动评估后,会给部分优质站点开通快速收录功能,缩短爬虫发现资源的时间,对于高时效性内容推荐使用快速收录工具,实时向搜索推送资源,一般情况下48小时内即可实现收录。


(1)注意事项:


快速收录仅限于提交移动端页面及移动端自适应页面。


·提交的资源应符合移动体验标准,判断站点是否符合移动体验标准。


·如果网站已通过HTTPS认证工具验证为HTTPS网站,请确保所提交链接的协议头为HTTPS。


(2)数据反馈


·开发者们可以在”快速收录—数据反馈“页面查看当天累计提交的去重后的已收录量和未收录量;


·开发者们可以查看“最近7天”和“最近30天”的数据。


3、死链提交


死链提交工具是站点向百度提交死链的数据推送工具,被推送的死链将被百度搜索屏蔽。站点若存在大量的死链,将影响百度搜索对站点的评价,建议存在大量失效内容的站点及时使用死链提交工具将要删除的内容推送给百度。


(1)注意事项:


请勿提交索引型sitemap,索引型不予处理,且若存在索引型sitemap,将不允许提交新文件;请删除索引型sitemap后再尝试提交数据;


文件地址格式为txt或xml,每个地址文件最多包含50000个网址且需小于10MB;


如果验证了网站的主域,那么sitemap文件中可包含该网站主域下的所有网址;您每次最多可提交20条文件地址;


仅识别404数据,请勿提交非死链内容;如误使用本工具,且站点内容不为死链,则提交不会生效。


死链抓取后生效时间为1周,如超时未生效,请在反馈中心提交反馈。


(2)近期变化:


为了提升站点提交的优质资源的处理效率,搜索资源平台上线了配额机制,对平台工具的sitemap文件提交配额进行限制,包括“资源提交-普通收录-sitemap提交”和“链接提交-死链提交”。平台将基于站点资源质量和搜索用户喜欢程度综合评估计算站点提交配额,站点不同,提交配额也可能不同。


请勿提交索引型sitemap,索引型不予处理,且若存在索引型sitemap,将不允许提交新文件;请删除索引型sitemap后再尝试提交数据


已处理完毕的死链文件可以在”死链提交—数据反馈“中删除,释放文件余额。


尚未处理完毕的历史死链文件可以通过重新提交加快处理速度。


(3)数据反馈:


开发者们可以在”死链提交—数据反馈”板块查看死链文件状态和死链处理状;开发者们可以点击异常状态,如“抓取失败”、“索引型文件不予处理”等,查看文件错误详情和修改建议。


4、移动适配


百度移动搜索提供“移动适配”服务,如果开发者们同时拥有PC站和手机站,且二者能够在内容上对应的站点,可以通过【移动适配】工具向百度搜索提交PC页面和移动页面的对应关系,获取移动流量。


可以提升用户在百度移动端的搜索体验,有利于站点在移动端的搜索结果中获得更多的展现与点击。


(1)注意事项:


自适应站点不需使用移动适配工具;


移动适配工具不能解决移动端排序问题,搜索排序异常请在反馈中心提交;


移动适配工具校验时间为14天,如数据提交14天后仍未校验完成,请尽快在反馈中心提交问题;


二、数据统计


1、索引量


索引量指可以被搜索用户搜索到的站点数据库,索引量工具同时支持站点自定义想要关注的目录,查看某一目录规则下的索引量。索引量不等于流量,索引量会有定期数据波动,属于正常现象。


【索引量工具】


索引量工具可以支持查看总索引量,同时支持站点自定义想要关注的目录,查看某一目录规则下的索引量。


更新频率:百度索引数据最快每天更新一次,最迟一周更新一次,不同站点的更新日期可能不同。


开发者们可以在”索引量“工具中查看“最近30天”与自定义日期的索引情况。


您可以查询到近一年中每天的索引量数据,一年前的索引量数据为每月索引量数据。


2、流量与关键词


提供站点的热门关键词在百度搜索结果中的展现及点击量数据,同时提供关键词定制功能,方便网站根据需求设置需要重点关注的关键词,通过对关键词表现情况的监控,帮助网站更好进行优化。


区分PC搜索和移动搜索的数据。


可查看“最近7天”、“最近30天”和自定义日期的数据;设置范围如果超过最近30天,则无法查询详情数据。


3、抓取频次


搜索引擎在单位时间内(天级)对网站服务器抓取的总次数。


(1)注意事项


Baiduspider会根据网站服务器压力自动进行抓取频次调整;


抓取频次过大:很有可能造成服务器不稳定,影响网站正常访问;


抓取频次过小:影响站点收录。


(2)当前抓取频次过大怎么办?


·如果抓取了过多的无价值页面,可以更新网站robots文件;


·合理调节抓取频次上限值。


(3)当前抓取频次过小怎么办?


·取消或调整抓取频次上限值;


·使用抓取异常工具辅助诊断;


·通过资源提交工具主动提交资源。


4、抓取诊断


让站长从百度蜘蛛的视角查看抓取内容,自助诊断百度蜘蛛看到的内容和预期是否一致。


(1)注意事项:


·区分pc端和移动端的数据;


·每周可使用70次抓取诊断工具;


·抓取结果只展现百度蜘蛛可见的前200KB内容;


·可能受到网络影响造成抓取失败,如抓取失败可重新检测,自查网站能否正常访问。


5、抓取异常


(1)抓取异常:百度spider无法正常抓取的情况。


(2)抓取异常的原因有哪些


1)网站异常


网站异常包括DNS异常、连接超时、抓取超时和链接错误四种情况。


·DNS异常


当Baiduspider无法解析网站的IP时,会出现DNS异常。可能是网站IP地址错误,或者域名服务商把Baiduspider封禁。请开发者们先自查网站IP地址是否正确且可解析,如果不正确或无法解析,请与域名注册商联系,更新您的IP地址。


·连接超时


抓取请求连接超时,可能是因为服务器过载或者网络不稳定。


·抓取超时


抓取请求连接建立后,下载页面速度过慢,导致超时,还可能是因为服务器过载,带宽不足。


·连接错误


无法连接或者连接建立后对方服务器拒绝。


2)链接异常


链接异常包括服务器错误、访问被拒绝、找不到页面和其他错误四种情况。


·服务器错误:响应代码——5XX


·访问被拒绝:响应代码——403


·找不到页面:响应代码——404(百度会自动进行死链屏蔽)


·其他错误:响应代码——4XX(不包括403和404)


6、Robots工具【告诉百度哪些内容不需要被收录】


开发者们可以通过Robots工具来创建、校验、更新您的robots.txt文件,或查看您网站robots.txt文件在百度生效的情况。


(1)注意事项:


·如希望收录网站上所有内容,请勿建立robots.txt文件;


·Robots工具目前支持48k的文件内容检测,请保证您的robots.txt文件不要过大,目录最长不超过250个字符。


·放置在网站根目录下,比如https://www.nmgjoin.com/robots.txt


7、网站改版工具【变更站点目录、域名等信息】


当站点的域名或者目录发生变化时,如果想让百度快速收录变化之后的新链接、用以替换之前的旧链接,那么就需要使用网站改版工具来提交站点的改版关系,加速百度对已收录链接的新旧替换。


(1)注意事项


·推荐使用站点改版和规则改版;


·改版规则中的新旧链接一定要使用301的方式进行跳转;


·您提交的三类改版形式,不能有交叉或者包含关系,即不能有一条链接同时属于多个改版形式;


·仅用于网站URL改变,不适用于网站内容改版;


·改版跳转关系请至少保持三个月,直到新站流量完全稳定;


·改版生效时间:改版规则校验时间为0.5—2小时;改版生效时间为12—48小时;整体来看,从提交改版规则到线上生效,最短12.5小时,最长50小时;提交改版规则72小时后仍提示“改版中”,可通过反馈中心提交反馈。


(2)改版状态反馈:


提交网站改版之后,开发者们可以在”网站改版“工具页面中查看处理状态;一共会出现5种情况:


·规则校验中


·校验失败:原因可能是提交重复规则/未设置301跳转/旧链抓取失败/新链抓取失败/跳转关系与规则不符/url与所提交站点不匹配/正则格式不正确/url对文件格式不正确等。


·无需改版(未收录的旧链接无法处理)


·改版进行中


·改版完成


8、闭站保护


指由于网站自身原因(改版、暂停服务等)或客观原因(服务器故障、政策影响等)造成的网站较长一段时间都无法正常访问。


(1)闭站保护工具


·申请闭站:开发者们可以通过闭站保护工具进行提交申请,申请通过后,百度搜索引擎会暂时保留有价值的索引、暂停抓取站点、暂停其在搜索结果中的展现。


·恢复网站:待网站恢复正常后,站长可通过闭站保护工具申请恢复,申请审核通过后,百度搜索引擎会恢复对站点的抓取和展现,站点的评价得分不会受到影响


(2)注意事项:


·关闭站点后应立即申请闭站保护,申请不及时可能导致站点被判死链,影响后续收录和展现;


·方式:保证域名可解析的前提下,全站HTTP状态码设置为404或切断电源关闭服务器;


·生效:申请闭站保护,若通过审核将在1天内生效;申请取消闭站保护,若通过审核将在2天内生效;


·闭站保护期最长为180天,超过180天将自动取消;


·使用闭站工具只能保留网站索引量,但不保证网站排名不变;


·闭站保护期间,为了满足用户的寻址需求,首页会被豁免,不予屏蔽。