Categories


Tags


关于URL组成部分的指南

原文地址:Talk like a Googler: parts of a url

作者:Matt Cutts   Google反垃圾网站组的带头人

让我们来解剖一个 URL 的所有部分。我将告诉你,在 Google 通常所涉及的分别指 URl 的哪些不同部分 。这是一个有效的 URL,并包含很多元素:

http://video.google.co.uk:80/videoplay?docid=-7246927612831078230&hl=en#00h02m30s

以上 URL 的组成元素分解:

传输协议是:http,类似的协议还包含:https,ftp, etc。

主机或主机名:video.google.co.uk 。

子域名是:video。

域名是:google.co.uk。

顶级域名(TLD)是:uk。uk 指的是国家顶级域名(ccTLD)。比如:google.com 其中顶级域名是 com。

二级域名(SLD)是:com.uk。

端口:80,这是 web 服务器的默认端口。其他的端口也是允许的,比如:web 服务器还可以听端口8000。当端口是80 时,很多人放空不写。

路径:/videoplay。路径通常指一个文件或 web 服务器上的一个位置。如:/directory/file.html 。

以上 URL 包含参数。参数名字是 docid,参数的值是-7246927612831078230。URLs 可以有很多参数。参数以问号(?)开始,以(&)隔开。

看到了“#00h02m30s”了吗?这称为一个字符串或一个命名锚链。字符串过去通常指网页文件中的一个内部片段。在这个例子中,这个命名锚链的意思是“2分30秒后跳转到视频”。我现在想起来,Google 通过移除字符串以实现 URL 标准化。

什么是静态 URL 或动态 URL?技术上,我们认为静态 URL 指的是服务器返回一个页面时不需要进行任何数据库操作。动态 URL 指,在返回页面之前,服务器需要进行相应的运算。

一些人通过问一个问题来简单区别静态 URL和动态 URL:“这个URL 中有没有问号(?)”。如果有问号,则一般认为是动态 URL;相反,则一般是静态 URL。当然,这不是一个硬性而有效的规则。比如,http://www.seowhy.com/26_87_zh.html  (译者按) 这个URL 看起来像是静态的,但它却需要 web服务器来处理。

来源:搜外网


Public @ 2021-08-06 16:11:12

常见的robots.txt文件用法实例

常见的robots.txt文件用法实例:1、禁止所有搜索引擎抓取网站的任何部分User-agent: *Disallow: /这是禁止所有目录和文件被所有搜索引擎收录。网站还没上线时,有的会先屏蔽所有蜘蛛抓取。2、允许所有的spider抓取(或者也可以建一个空的robots.txt文件)User-agent: *Allow: /这是允许所有搜索引擎抓取网站的任何部分,既然是允许所有文件被抓取,可以

Public @ 2010-05-21 16:09:23

Windows IIS下论坛静态化分析

这两天研究Discuz 4.1,并成功地将原来一个Discuz 2.5的论坛升级到了最新版本,个人感觉这个论坛实在不错。我的Discuz 4.1是在Apache+Php+Mysql下运行的,并开启了Url Rewrite,之后我发现整个论坛的大部分页面都可以使用html的静态地址方式来访问,感觉真不错,Apache实在太强大了,难怪现在用Apache的站点那么多。IIS下能否也实现这种静态化功能呢

Public @ 2014-12-25 16:11:10

什么是URL标准化(规范网页),URL标准化设置

开始之前我需要给大家强调一个思路,每个关键词应该对应一个URL而不是多个。(但一个URL可以对应多个关键词。)一个网站的首页,往往通过几个不同的URL可以访问到,举个例子:https://www.seowhy.com/https://seowhy.comhttps://www.seowhy.com/index.htmlhttps://www.seowhy.com/index.php搜外首页的关键词

Public @ 2009-11-06 16:11:59

更多您感兴趣的搜索

0.419423s