sdcms网站的robots文件的写法

sdcms网站的robots文件的写法,www.laomu.net就是在sdcms基础上制作而成的。
今天来和大家说话sdcms网站的robots文件的写法
SDCMS系统以DIV+CSS为框架,在主流的IE和FF浏览器上测试均能正常运行。系统全自动生成Html文件,无需独自生成任何文件。网站开发者是从事职业SEO转行,对SEO支持的比较好,是许多做企业站SEO的常用程序。程序默认是没有robots.txt文件的,为了更加完善此系统SEO特性,经我们分析,可以为SDCMS系统添加robots.txt文件,禁止收录一些对排名无用的文件,加快索引速度,从而利于提高排名。
SDCMS robots.txt文件内容:
User-agent: *
Disallow: /Editor/
Disallow: /Inc/
Disallow: /Install/
Disallow: /Search/
Disallow: /Skins/
Disallow: /Update/
SDCMS robotx.txt文件优化写法说明:我们采用禁止所有搜索引擎收录以上目录下的所有文件,仅收录静态页面生成目录的策略。如果你的静态文件存在以上目录,请删除Disallow所在行目录。
最简单的 robots.txt 文件使用两条规则:
User-agent:应用以下规则的漫游器
Disallow:要拦截的网址
这两行会视为文件中的一个条目。您可根据需要加入任意多个条目。您可在一个条目中加入多个 Disallow 行和多个 User-agent。
robots.txt 文件的各个部分都是独立的,而不是在先前部分的基础上构建的。例如:
User-agent: *
Disallow: /文件夹 1/User-Agent: Googlebot
Disallow: /文件夹 2/
在本例中,只有符合 /文件夹 2/ 的网址才会被 Googlebot 禁止。
User-agent 和漫游器
User-agent 是一种特定的搜索引擎漫游器。网络漫游器数据库列出了许多常用的漫游器。您可以将某一条目设置为适用于某一特定漫游器(以显示名称的方式列出)或适用于所有漫游器(以标记为星号的方式列出)。适用于所有漫游器的条目应为以下格式:
User-agent: *
Google 使用多种不同的漫游器 (User-agent)。我们的网页搜索所使用的漫游器为 Googlebot。Googlebot-Mobile 和 Googlebot-Image 等其他漫游器也会遵循您为 Googlebot 所设置的规则,但您也可以为这些特定的漫游器设置特定的规则。
拦截 User-agent
Disallow 行列出的是您要拦截的网页。您可以列出某一特定的网址或模式。条目应以正斜线 (/) 开头。
要拦截整个网站,请使用正斜线。
Disallow: /
要拦截某一目录以及其中的所有内容,请在目录名后添加正斜线。
Disallow: /无用目录/
要拦截某个网页,请列出该网页。
Disallow: /私人文件.html
要从 Google 图片中删除特定图片,请添加以下内容:
User-agent: Googlebot-Image
Disallow: /images/狗.jpg
要从 Goo le 图片中 除您网站上的所有图片,请执行以下指令:
User-agent: Googlebot-Image
Disallow: /
要拦截某一特定文件类型的文件(例如 .gif),请使用以下内容:
User-agent: Googlebot
Disallow:
要拦截对所有包含问号 (?) 的网址的访问(具体地说,这种网址以您的域名开头、后接任意字符串,然后接问号,而后又接任意字符串),请使用以下内容:
User-agent: Googlebot
Disallow: /*?
要指定与某个网址的结尾字符相匹配,请使用 $。例如,要拦截以 .xls 结尾的所有网址,请使用以下内容:
User-agent: Googlebot
Disallow: /*.xls$
您可将此模式匹配与 Allow 指令配合使用。例如,如果 ? 代表一个会话 ID,那么您可能希望排除包含 ? 的所有网址,以确保 Googlebot 不会抓取重复网页。但是以 ? 结尾的网址可能是您希望包含在内的网页的版本。在此情况下,您可以对您的 robots.txt 文件进行如下设置:
User-agent: *
Allow: /*?$
Disallow: /*?
Disallow: /*? 指令会阻止包含 ? 的所有网址(具体地说,它将拦截所有以您的域名开头、后接任意字符串,然后接问号,而后又接任意字符串的网址)。
Allow: /*?$ 指令将允许以 ? 结尾的任何网址(具体地说,它将允许所有以您的域名开头、后接任意字符串,然后接 ?,? 之后不接任何字符的网址)。

来源:新浪博客

相关推荐

没有资料

微信扫一扫

微信扫一扫

微信扫一扫,分享到朋友圈

老木是你永远的朋友
返回顶部