百度爬虫类型(Baiduspider)及robots设置方法

百度爬虫类型(Baiduspider)及robots设置方法Baiduspider 的 user agent 是什么 百度各个产品使用不同的 user agent table b 产品名称 b b 对应 user agent b 无线搜索 Baiduspider mobile 图片搜索 Baiduspider image 视频搜索 Baiduspider video 新闻搜索 Baiduspider news

Baiduspider的user-agent是什么?百度各个产品使用不同的user-agent:

[table]
|[b]产品名称[/b] |[b]对应user-agent[/b]
|无线搜索 | Baiduspider-mobile
|图片搜索 | Baiduspider-image
|视频搜索 | Baiduspider-video
|新闻搜索 | Baiduspider-news
|百度搜藏 | Baiduspider-favo
|百度联盟 | Baiduspider-cpro
|网页以及其他搜索 | Baiduspider
[/table]

你可以根据各产品不同的user-agent设置不同的抓取规则,如果你想完全禁止百度所有的产品收录,可以直接对Baiduspider设置禁止抓取。在robots.txt中禁止爬虫抓取([url=http://www.baidu.com/search/robots.html]robots.txt写作方法[/url])

以下robots实现禁止所有来自百度的抓取:
User-agent: Baiduspider
Disallow: /

以下robots实现仅禁止来自百度视频搜索的抓取:
User-agent: Baiduspider-video
Disallow: /

以下robots实现禁止所有来自百度的抓取但允许图片搜索抓取/image/目录:
User-agent: Baiduspider
Disallow: /

User-agent: Baiduspider-image
Allow: /image/
请注意:Baiduspider-cpro抓取的网页并不会建入索引,只是执行与客户约定的操作,所以不遵守robots协议,如果 Baiduspider-cpro给您造成了困扰,请联系。



























版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/227502.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月16日 下午9:10
下一篇 2026年3月16日 下午9:10


相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号