影响网站收录之:规范、简单的url


影响网站收录之:规范、简单的url

创建具有良好描述性、规范、简单的url,有利于用户更方便的记忆和判断网页的内容,也有利于搜索引擎更有效的抓取您的网站。网站设计之初,就应该有合理的url规划。

百度建议

1.网站中同一网页,只对应一个url

如果网站上多种url都能访问同样的内容,会有如下危险:

a. 搜索引擎会选一种url为标准,可能会和正版不同
b. 用户可能为同一网页的不同url做推荐,多种url形式分散了该网页的权重

如果你的网站上已经存在多种url形式,建议按以下方式处理:

a. 在系统中只使用正常形式url,不让用户接触到非正常形式的url
b. 不把Session id、统计代码等不必要的内容放在url中
c. 不同形式的url,301永久跳转到正常形式
d. 防止用户输错而启用的备用域名,301永久跳转到主域名
e. 使用robots.txt禁止Baiduspider抓取您不想向用户展现的形式

2.让用户能从url判断出网页内容以及网站结构信息,并可以预测将要看到的内容

3.URL尽量短

长长的URL不仅不美观,用户还很难从中获取额外有用的信息。另一方面,短url还有助于减小页面体积,加快网页打开速度,提升用户体验。

4.正常的动态url对搜索引擎没有影响

url是动态还是静态对搜索引擎没有影响,但建议尽量减少动态url中包含的变量参数,这样即有助于减少url长度,也可以减少让搜索引擎掉入黑洞的风险。

5.不添加不能被系统自动识别为url组成部分的字符

url中加入了";"、","等字符,用户在通过论坛、即时通讯工具等渠道推荐这些url时,不能被自动识别为链接,增加了用户访问这些网页的困难度。

6.利用百度提供的URL优化工具检查

百度站长平台提供了URL优化工具,可以帮助检查URL对搜索引擎的友好程度并提出修改建议。

简单规范的网址.jpg


google的建议:保持简单的网址结构

网站的网址结构应尽可能简单些。建议您组织一下您的内容,让网址的结构合乎逻辑并易于人们理解(尽可能采用易读的字词而非冗长的ID编号)。例如,如果您要搜索有关aviation的信息,en.wikipedia.org/wiki/Aviation一类的网址将可帮助您决定是否点击该链接。而 www . example.com/index.php?id_sezione=360&sid=3a5ebc944f41daa6f849f730f1 一类的网址对用户的吸引力大大降低。

规范网址1.jpg


过于复杂的网址,特别是那些包含多个参数的网址,可能会给抓取工具带来麻烦,因为它们可能会产生大量不必要的网址,全都指向您网站上相同或相似的内容。Googlebot可能会因此而消耗大量不必要的带宽,也可能无法将您网站上的所有内容完整编入索引。

此问题的常见原因
导致网址过多可能有多种原因,其中包括:

对一组项目的过度过滤 很多网站为同一组项或搜索结果提供不同的视图,通常可让用户使用定义的标准进行过滤(例如:显示海景酒店)。当以累加方式合并过滤器时(例如:带健身中心的海景酒店),网站中网址(数据视图)的数量就会急剧增加。因为Googlebot只需查看少量能用来访问各个酒店网页的列表即可,所以没有必要创建大量区别不大的酒店列表。例如:

QQ截图20150215174019.jpg


动态生成文档。由于计数器、时间戳或广告影响,这可能会产生少量变化。

网址中的问题参数。例如,会话ID会创建大量重复内容以及较多网址。

排序参数。 某些大型购物网站会提供多种方式来为相同的商品排序,从而造成网址数量大增。例如:
不规范的网址1.jpg

网址中不相关的参数,例如引荐参数。 例如:
不规范的网址2.jpg

日历问题。 动态生成的日历可能会生成指向未来及过去日期的链接,而这些日期没有开始或结束期限。例如:
不规范的网址3.jpg

相对链接损坏 。损坏的相对链接往往会导致无限循环。这个问题通常是由路径元素重复造成的。例如:
不规范的网址4.jpg

解决此问题的方法
为避免网址结构出现潜在问题,建议您采取以下措施:

您可考虑使用robots.txt文件阻止Googlebot访问有问题的网址。一般情况下您应考虑阻止动态网址,例如会生成搜索结果或无限循环(如日历)的网址。在robots.txt文件中使用正则表达式可以轻松拦截数量较大的网址。

尽可能避免在网址中使用会话ID。您可考虑改用Cookie。请参阅我们的网站站长指南,以了解更多信息。

截掉不必要的参数,尽量缩短网址。

如果您的网站日历未设置期限,请为指向动态创建的未来日历页的链接添加nofollow属性。

检查网站是否存在损坏的相对链接。

补充:

URL尽量不使用中文,如很多博客的tag都是中文的,也有的网站的搜索结果页面URL也是中文的。百度认为这类型的URL是没意义的,在移动端显示也不准确。参考地址:http://bbs.zhanzhang.baidu.com ... .html
已邀请:

要回复问题请先登录注册