索引结构及其使用－金锄头文库

资源描述

《索引结构及其使用》由会员分享，可在线阅读，更多相关《索引结构及其使用（14页珍藏版）》请在金锄头文库上搜索。

1、SQL Server索引结构及其使用一）一、深入浅出理解索弓结构实际上，您可以把如I理解为T中特殊的目录。微软的SQL SERVER提供了两种如I：聚集如l（clusteredindex, 也称聚类索引、簇集索引）和非聚集索引（nonclistered index也称聚类索引、非簇集索引）。下面，我们举例来说明一下聚集索引和非聚集索引的区别：其实，我们的汉语字典的正文本身就是一个聚集索引。比如，我们要查安字，就会艮自然地翻开字典的前几页，因为、安”的拼音是奇”而按照拼音排序汉字的字典是以英文字母a开头并以二结尾的那么安字就自然地排在字典的前部。如果您翻完了所有以字开头的部分仍然找不到这

2、个字，那么就说明您的字典中没有这个字同样的，如果查张字，那您也会将您的字典翻至最后部分，因为张的拼音是3明”也就是说，字典的正文部分本身就是一个目录，您不需要再去查其他目录来找到您需要找的内容。我们把这种正文内容本身就是一种按照一定规则排列的目录称为、聚集索引。如果您认识某个字，您可以快速地从自动中查到这个字。但您也可能会遇到您不认识的字，不知道它的发音，这时候您就不能按照刚才勺方法找到您要查勺字，而需要去根据偏旁部首查到您要找的字然后根据这个字后的页码直接翻到某页来戈到您要找的字。但您结合部首目录和检字表而查到的字的排序并不是真正的正文勺排序方法，比如您查张字，我们可以看到在查

3、部首之后的检字表中张的页码是672页，检字表中张勺勺上面是驰字，但页码却是63页张的下面是弩字，页面是390页。彳艮显然，这些字并不是真正勺分别位于张字的上下方，现在您看到勺连续的驰、张弩三字实际上就是他们在非聚集索弓中的排序是字典正文中的字在非聚集索弓中的映射。我们可以通过这种方式来找到您所需要的字但它需要两个过程，先找到J目录中的结果，然后再翻到您所需要的页码。我们把这种目录纯粹是目录正文纯粹是正文勺排序方式称为非聚集索引。通过以上例子，我们可以理解到什么是聚集索引非聚集索引。进一步引申一下，我们可以艮容易的理解：每个表只官有一个聚集索引，因为目录只能按照一种方法进行排序。

4、二、何时使用募集索弓或非聚集索引下面的表总结了何时使用聚集索引或非聚集索引（很重要）:动作描述使用聚集索引使用非聚集索引列经常被分组排序应应返回某范围内的数据应不应一个或极少不同值不应不应小数目的不同值应不应大数目的不同值不应应频繁更新的列不应应外键列应应主键列应应频繁修改索弓列不应应事实上，我们可以通过前面聚集索引和非聚集索弓的定义的例？来理解上表。如：返回某范围内勺数据一项比如您的某个表有一个时间列，恰好您把聚合索引建立在了该列，这时您查询2004年1月1日至2004年10月1日之间的全部数据时这个速度就将是很快勺，因为您的这本字典正文是按日期进行排序的聚类索弓只需要找到要检索

5、的所有数据中的开头和结商据即可；而不像非聚集索引必须先查到目录中查到每一项数据对应的页码，然后再根据页码查到具体内容。三、结合实际，谈索弓使用的误区理论的目的是应用。虽然我们冈才列出了何时应使用聚集索弓或非聚集索引，但在实践中以上规则却很容易被忽视或不能根据实际情况进行综合分析。下面我们将根据在实践中遇到的实际问题来谈一下索引使用的误区以便于大家掌握索引建立勺方法1、主键就是聚集索引这种想法笔者认为是极端错误的是对聚集索引的一种浪费。虽然SQL SERVER认是在主键上建立聚集索引血通常，我们会在每个表中都建立一个D歹U，以区分每条数据，并且这个D列是自动增大的，步长一般为1。我们

6、的这个办公自动化的实例中的列Gd就是如此此时，如果我们将这个列设为主键SQL SERVER会将此歹默认为聚集索引。这样做有好处就是可以让您的数据在数据库中按照D进行物理排序，但笔者认为这样做意义不大。显而易见聚集索引的优势是很明显的而每个表中只能有一个聚集索引的规则，这使得聚集如|变得更加轸贵。从我们前面谈到的聚集索引的定义我们可以看出，使用聚集索引的最大好处就是能够根据查询要求，迅速缩小查询范围，避免全表扫描在实际应用中，因为ID号是自动生成的，我们并不知道每条记录的ID号，所以我们很难在实践中用 ID号来进行查询。这就使让ID号这个主键作为聚集索弓成为一种资源浪费其次，让每个ID

7、号都不同的字段作为聚集索引也不符合大数目的不同值情况下不应建立聚合索引规则；当然这种情况只是针对用户经常修改记录内容，特别是索引项的时候会负作用，但对于查询速度并没有影响。在办公自动化系统中，无论是系统首页显示的需要用户签收的文件、会议还是用户进行文件查询等任何情况下进行数据查询都离不开字段的是日期还有用户本身的用户名。通常，办公自动化的首页会显示每个用户尚未签收的文件或会议虽然我们的where句可以仅仅限制当前用户尚未签收的情况，但如果您的系统已建立了很长时间，并且数据量很大那吆，每次每个用户打开首页的时候都进行一次全表扫描，这样做意义是不为勺，绝大多数的用户1个月前的文件都已经

8、浏览过了，这样做只能徒增数据库的开销而已。事实上，我们完全可以让用户打开系统首页时，数据库仅仅查询这个用户近3个月来未阅览勺文件，通过日期这个字段来限制表扫描提高查询速度如果您的办公自动化系统已经建立的2年，那么您的首页显示速度理论上将是原来速度8倍，甚至更快。在这里之所以提至理论上三字是因为如果您的聚集索引还是盲目地建在ID这个主键上时您的查询速度是没有这么高的，即使您在、日期这个字段上建立的索引(非聚合索引)。下面我们就来看一下在1000万条数据量的情况下各种查询的速度表现(3个月内的数据为25万条):(1) 仅在主键上建立聚集索引，并且不划分时间段：Select gid,fa

9、riqi,neibuyonghu,titlfe2om tgongwen用时：128470毫秒(即：128秒)(2) 在主键上建立聚集索引，在fariq上建立非聚集索引：select gid,fariqi,neibuyonghu,titlfrom Tgongwenwhere fariqi dateadd(day,-90,getdate()用时：53763毫秒(54秒)(3) 将聚合索弓建立在0期列(fariq)上：select gid,fariqi,neibuyonghu,titlfe:om Tgongwenwhere fariqi dateadd(day,-90,getdate()用时：242

10、3毫秒(2秒)虽然每条语句提取出来的都是25万条数据，各种情况的差异却是巨大的，特别是将聚集索弓建立在0期列时勺差异。事实上如果您的数据库真的有1000万容量的话把主键建立在ID列上就像以上勺第1、2种情况在网页上勺表现就是超时根本就无法显示。这也是我摒弃ID列作为聚集索引的一个最重要勺因秦得出以上速度的方法是：在各个sel ect语向前加：declare d datetimeset d=getdate()并在 selects句后加：select 语句执行花费时间(毫秒)=datediff(ms,d,getdate()2、只要建立索引就能显著提高查询速度事实上，我们可以发现上面的

11、例？中，第2、3条语句完全相同，且建立索引的字段也相同；不同的仅是前者在farqi 字段上建立的是非聚合索引，后者在此字建立的是聚合索引，但查询速度却有着天壤之别。所以并非是在(壬何字段上简单也建立索弓就能提高查询速度从建表的语句中，我们可以看到这个有着1000万数据的表中farqi字段有5003个不同记录在此字段上建立聚合索引是再合适不过了。在现实中，我们每天者会发几个文件，这几个文件的发文日期就相同这完全符合建立聚集索弓要求的：“既不能绝大多数都相同，又不能只有极少数相同的规则由此看来我们建立适当的聚合索引寸于我们提高查询速度是非常重要的。3、把所有需要提高查询速度的字段都加

12、进聚集如I，以提高查询速度上面已经谈到在进行数据查询时都离不开字段的是日期还有用户本身的、用户名。既然这两个字段都是如此的重要，我们可以把他们合并起来建立一个复合索引(compoundindex)。彳艮多人认为只要把任何字段加雌集如I，就能提高查询速度也有人感到迷惑：如果把复合的聚集索引字段分开查询，那吆查询速度会减慢马？带着这个问题我们来看一下以下的查询速度结果集都是25万条数据)：(日期列farqi 首先排在复合聚集索引的起始列，用户名nebuyonghu排在后列：(1) select gid,fariqi,neibuyonghu,title fTgongwenwhere far

13、iqi2004-5-5查询速度：2513毫秒(2) select gid,fariqi,neibuyonghu,title fTgongwenwhere fariqi2004-5-5and neibuyonghu=办公室查询速度：2516毫秒(3) select gid,fariqi,neibuyonghu,title fTgongwenwhere neibuyonghu=办公室查询速度：60280毫秒从以上试验中，我们可以看到如果仅用聚集索引的起始列作为查询条件和同时用到复合聚集索引的全部列的查询速度是几乎一样的甚至比用上全部的复合索弓列还要略快(在查询结果集数目一样的情况下)；而如果仅

14、用复合聚集索引的非起始列作为查询条件的话，这个索引是不起任何作用的。当然，语句1、2的查询速如样是因为查询的条目数一样，如果复合索引的所有列者用上，而且查询结果少的话，这样就会形成索引覆盖，因而性能可以达到最优。同时，请记住无论您是否经常使用聚合索引的其他列，但其前导列一定要是使用最频繁的列四、其佛上没有的索引使曜验总结1、用聚合索引比用不是聚合索引的主键速度快下面是实例语句：(都是提取25万条数掘selectgid,fariqi,neibuyonghu,reader,titleom Tgongwenwhere fariqi=2004-9-16使用时间：3326毫秒select gid,

15、fariqi,neibuyonghu,reader,titleomTgongwenwhere gid=250000使用时间：4470毫秒这里，用聚合索引比用不是聚合索引的主键速度快了近1/4。2、用聚合索引比用一般的主键作order by时速度快，特别是在小数据量情况下select gid,fariqi,neibuyonghu,reader,titleom Tgongwenorder by fariqi用时：12936selectgid,fariqi,neibuyonghu,reader,titleom Tgongwenorder by gid用时：18843这里，用聚合索引比用一般的主键作order by时，速度快了3/1Q事实上如果数据量很小的话，用聚集索弓作为排序列要比使用非聚集如1速度快得明显的多；而数据量如果很为勺话如10万以上，则二者的速度差别不明显。3、使用聚合如呐的时间段，搜索时、可会按数据占整个数据表的百分比成比例咸少，而无论聚合索引使用了多少个selectgid,fariqi,neibuyonghu,reader,titleom Tgongwenwhere f

展开阅读全文

索引结构及其使用

最新文档