robots.txt在线生成
简体中文
简体中文
繁體中文
English
操作指引
生成robots.txt,仅输出明确配置的爬虫
什么是robots.txt文件
- robots.txt(统一小写)是一种存放于网站根目录下的文本文件,用于告知搜索引擎爬虫哪些页面可以抓取,哪些不可以...
- 因为一些系统中的URL是大小写敏感的,所以robots.txt的文件名应统一为小写...
- 如果想单独定义搜索引擎的漫游器访问子目录时的行为...
- robots.txt协议并不是一个规范,而只是约定俗成的...
- Robots协议是国际互联网界通行的道德规范...
robots.txt文件内容
- 搜索引擎蜘蛛的是否可访问性或者说可爬行性。
- 搜索引擎蜘蛛针对目录或者文件的可访问性。
- 网站站点地图sitemap路径定义。
- 搜索引擎蜘蛛爬行的时间间隔限制。
关于robots.txt文件生成器
- 通过web界面设置好要配置的数据,点击生成器的生成即可在最下方的文本输入框获得robots.txt的文件内容。
- 现在,你创建一个空白的文本文件,命名为:“robots.txt”,然后把上面的内容,复制并粘贴到“robots.txt”中去。
- 把“robots.txt”放在你网站的根目录,访问robots.txt,确保他能让访问者(如搜索引擎)访问到。