地址: 上海市静安区共和新路4718弄10号楼2楼
热线:400-166-3538
电话:13122077371
邮箱:sales@shyuanzhen.cn
1.反斜杠的插入
还是以Disallow:/a/b.html为例,在编写该语句的时候,如果忘记加入了反斜杠,则是对全部内容进行开放,这与编写语句的想法相悖,因为反斜杠的意义是根目录。
2.空格的出现
空格的出现就很好理解了,因为搜索引擎对于这个特殊符号的出现并不识别,它的加入只会使语句失去应有的效用。
第二:编写的几个问题
1.Robots.txt编写的顺序问题
举个最简单的例子,如果你想让自己a文件中的b.html被抓取,那么你怎么编写呢?是Allow:/a/b.html Disallow:/a/ 还是Disallow:/a/ Allow:/a/b.html这样?
在Robots.txt编写规则中,它并不执行树状分析结构,换句话说编写时并不应该把母文件夹放在最前,而是遵循一种就近原则,如果我们把母文件夹放在前面,蜘蛛会认为这个途径被封闭了,不能访问,而我们最终的目的却是访问,这样一来,目标和实际就大相迳庭了。
2.Robots.txt编写的开放性问题
很多上海网站建设 的站长,尤其是新手站长对于Robots.txt的理解过于片面,他们认为既然Robots.txt可以规定蜘蛛的访问途径,那我们何必不开放,把所有文件都设置成可访问,这样一来网站的收录量不久立即上升了,其实问题远远没有我们想象的简单,大家都知道网站中一些固定的文件是不必传送给搜索引擎访问的,如果我们把网站“全方位开放”,后果就是加大网站服务器负载,降低访问速度,减缓蜘蛛的爬行率,对于网站收录没有一点用处,所以对于固定不需要访问的文件,我们直接Disallow掉就可以了。
一般情况下,网站不需要访问的文件有后台管理文件、程序脚本、附件、数据库文件、等等。
3.Robots.txt编写的重复性问题
我们每天都在写着原创内容,然后更新到自己的网站中,大家想过没有我们这样做的目的是什么?当然是为了讨搜索引擎的好,大家都知道搜索引擎很看重原创内容,对于原创内容的收录很快,相反,如果你的网站中充斥着大量的复制内容,那么我只能遗憾的告诉你,网站的前途一片渺茫。不过这也从另一个方面告诉我们要积极的利用robots文件禁止重复页面的代码,降低页面的重复度,但是在编写robots文件时一定要记得
在User-agent后加入某个搜索引擎,例如User-agent:BaiduSpider Disallow:/,如果没有加入,编写成User-agent: * Disallow: /形式,则是对网站所有内容的“屏蔽”。
4.Robots.txt编写的meta问题
在 Robots.txt编写规则中,有一个取最强参数法则,而且如果网站以及页面标签上同时出现robots.txt文件和meta标签,那么搜索引擎就会服从两个规则中较为严格的一个,即禁止搜索引擎对于某个页面的索引,当然如果robots.txt文件和meta标签不是出现一个文件中,那么搜索引擎就会遵循就近原则,就会索引meta标签前的所有文件。
一、网站主题相符
在做搜索引擎优化过程中,大家都知道,SEO中影响排名有一个非常重要的因素,就是相关性。相关性包含了内容与栏目的相关性、内容与首页的相关性。完成内容时候考虑用户进入到你这个首页,看到你这篇文章会不会点击你这篇文章,如果不会点击,那你这篇文章形同虚设。同理用户进入栏目看到你这篇文章会不会去点击你这篇文章,如果不会点击那就是你这篇文章写的有问题。多多换位思考会省不少事情。
二、原创的不一定是好的
为什么这么说呢,平常贝尔利给企业做网站后台编辑培训的时候都会讲一个关键词:内容质量。那么原创的内容一定是高质量的内容吗,答案肯定是否定的。什么是高质量的内容,高质量的内容是能满足用户需求,通过用户搜索的关键词,进入到你网站的页面能够完美的解决用户正需要的东西,这个就是高质量,与你原创不原创,关系并不是很大。当然了换句话说如果你既能解决用户需求,又是原创内容,这个是非常提倡的。搜索引擎判断内容是否是高质量内容其中有一个衡量标准,是否这篇内容花费了大量时间来编辑。
三、网站在百度中的整体评分
说俗点就是网站的权重,在优化过程中我们会见到很多网站出现秒收的情况,发布的文章几分钟就可以收录,这个通过SITE语法都可以去查询,那么这跟自己的网站权重以及内容更新习惯是有非常重要的关联。我们要学会给百度spider(蜘蛛)养成习惯,每天定时更新内容,spider就会在固定的时间来爬取你的网站,抓取新的内容。
既然说到这里了,我们就来先了解一下搜索引擎收录网站内容的基本流程。搜索引擎spider每日通过链接(这个可以是外部链接)抓取新产生(有变化)的URL地址,进入自己的筛选库;通过筛选库进行深层次的归类,应该把你的内容归属于某一种行业;再根据语义识别等繁琐的排序机制进行搜索结果导出,同时在这个时候,有一部分低质量的内容会被剔除掉。如下图是百度搜索引擎工作原理图:
百度搜索引擎工作原理图
四、需要做好spider引导
这点简单来说说吧,因为引导spider方法非常多,这里简单提提。内容写的再好,也需要给这篇内容做上好的入口,最好通过首页、列表有能够直接点击进这篇文章的链接,也可以想百度spider提交这篇文章的链接,让搜索引擎及时抓取。
• • • • | 公司名称:上海缘震网络科技有限公司 开户银行:中国工商银行上海市彭浦支行 银行账号:1001 2508 0930 0206 455 |
总部:上海市奉贤区金海公路6055号29号3楼 分部:上海市静安区共和新路4718弄10号楼2楼 商务官网:www.shyuanzhen.cn 彦蓁科技:www.shyanzhen.cn | 缘震网络成立于 2014 年,公司主要经营全案策划,高端品质网站建设、多媒体视频宣传片制作、微信公众号开发、微信小程序开发、商城定制、SEO优化、电商托管、空间托管、网站维护、应用软件开发、手机端APP开发、等为客户提供一条龙网络运营解决方案的的技术型企业。我们在人力资源、业务范围、设计、技术、服务、信誉度、规范管理及企业文化等诸多方面完善自己,公司目前已与千余家各类客户进行长期战略合作,提供专业的网站建设与运营服务。我们的口号:广结良缘、震古烁今! |
