索引深入浅出(5/10)：非聚集索引的B树结构在堆表

zoukankan html css js c++ java

索引深入浅出(5/10)：非聚集索引的B树结构在堆表
在“索引深入浅出：非聚集索引的B树结构在聚集表”里，我们讨论了在聚集表上的非聚集索引，这篇文章我们讨论下在堆表上的非聚集索引。

非聚集索引可以在聚集表或堆表上创建。当我们在聚集表上创建非聚集索引时，聚集索引键担当为行指针。在堆表里，文件号，页号和槽号（file id , page number and slot number）的组合在非聚集索引里担当为行指针。

我们来看下手头的一个例子。我们创建salesorderdetail表的副本，并在上面的productid和salesorderid 列创建创建非聚集索引。
1 DROP TABLE SalesOrderDetailHeap 2 3 SELECT * INTO dbo.SalesOrderDetailHeap FROM AdventureWorks2008r2.Sales.SalesOrderDetail 4 GO 5 CREATE UNIQUE INDEX Ix_ProductId ON SalesOrderDetailHeap(ProductId,Salesorderid)
收集非聚集索引相关信息：
1 TRUNCATE TABLE dbo.sp_table_pages 2 INSERT INTO sp_table_pages EXEC('DBCC IND(IndexDB,SalesOrderDetailHeap,2)') 3 GO 4 5 SELECT * FROM dbo.sp_table_pages ORDER BY IndexLevel DESC --根节点/索引页 6 DBCC TRACEON(3604) 7 DBCC PAGE(IndexDB,1,3720,3) 8 9 DBCC TRACEON(3604) 10 DBCC PAGE(IndexDB,1,3608,3)--叶子节点/索引页 11 12 DBCC TRACEON(3604) 13 DBCC PAGE(IndexDB,1,3908,3)--叶子节点/索引页 14 SELECT * FROM dbo.sp_table_pages WHERE IndexLevel=0 --叶子节点/索引页
根据上述信息进行非聚集索引逻辑示意图的绘制：

现在我们来分析下SQL Server如何存储堆表的非聚集索引，首先我们通过DBCC IND命令查看非聚集索引的页分配情况，最后一个参数，2是Ix_ProductId的索引号。
1 DBCC ind('IndexDB','SalesOrderDetailHeap',2)
一共返回298条记录，包括1个IAM页，288个索引页，我们用下列语句找下根层的页号：
1 SELECT * FROM dbo.sp_table_pages ORDER BY IndexLevel DESC
可以看到，indexlevel列最大值1的页号是3270，这个页就是根页，因为indexlevel列最大值是1，所以这个堆表的非聚集索引的B树结构只有2层，即根层和叶子层，也就是说288个索引页中，1个页是根层的根页（也是索引页），287个页是叶子层的索引页。我们来看看3270页的信息。
1 DBCC TRACEON(3604) 2 DBCC PAGE(IndexDB,1,3720,3)
输出结果，和聚集表里的非聚集索引的根页结构是一样的。

我们来看看叶子层的3608页。
1 DBCC TRACEON(3604) 2 DBCC PAGE(IndexDB,1,3608,3)--叶子节点/索引页
在聚集表的非聚集索引的叶子层，聚集键与非聚集键一齐加入了叶子层的页。这里我们没有聚集索引，索引SQL Server加了个行标识号（8 bytes大小），由文件号（2 bytes），页号（4 bytes）和槽号（2 bytes）组合而成。

从上图我们可以清楚看出，productid值为707，salesorderid值为43665的记录完整信息，可以在HeapRID 0xB800000001003E00位置找到。下面的查询可以帮我们把RID转为文件号：页号：槽号（FileId:PageId:SlotNo）格式。
1 DECLARE @HeapRid BINARY(8) 2 SET @HeapRid = 0xB800000001003E00 3 SELECT 4 CONVERT (VARCHAR(5), 5 CONVERT(INT, SUBSTRING(@HeapRid, 6, 1) 6 + SUBSTRING(@HeapRid, 5, 1))) 7 + ':' 8 + CONVERT(VARCHAR(10), 9 CONVERT(INT, SUBSTRING(@HeapRid, 4, 1) 10 + SUBSTRING(@HeapRid, 3, 1) 11 + SUBSTRING(@HeapRid, 2, 1) 12 + SUBSTRING(@HeapRid, 1, 1))) 13 + ':' 14 + CONVERT(VARCHAR(5), 15 CONVERT(INT, SUBSTRING(@HeapRid, 8, 1) 16 + SUBSTRING(@HeapRid, 7, 1))) 17 AS 'Fileid:Pageid:Slot'
1:184:62表示文件号：1 ，页号：184 ，槽号:62。我们来看看184页。
1 DBCC TRACEON(3604) 2 DBCC PAGE(IndexDB,1,184,3)
从输出我们可以看到，productid值为707，salesorderid值为43665的记录所有列可以在槽号62找到，与1:184:62表示文件号：1 ，页号：184 ，槽号:62完全一致。

我们通过下面的查询看看SQL Server如何使用非聚集索引查找堆表上的数据，点击工具栏的显示包含实际的执行计划。
1 SET STATISTICS IO ON 2 GO 3 SELECT * FROM SalesOrderDetailHeap WHERE productid=707 AND SalesOrderid=43665
SQL Server需要进行2次I/O操作到达非聚集索引的叶子层，1次I/O操作通过使用RID查找（堆）拿到剩下的数据。执行计划如下所示：

即使我们将查询语句修改为，只要 ProductId,SalesOrderid,SalesorderDetailId 这3列,SQL Server还是要进行键查找（Key lookup）操作。
1 SET STATISTICS IO ON 2 GO 3 SELECT * FROM SalesOrderDetailHeap WHERE productid=707 AND SalesOrderid=43665 4 5 SET STATISTICS IO ON 6 GO 7 SELECT ProductId,SalesOrderid,SalesOrderDetailID FROM SalesOrderDetailHeap WHERE productid=707 AND SalesOrderid=43665
这是因为，SalesorderDetailId列没有定义为聚集键，在非聚集索引的叶子层没有这列。为了避免键查找（key lookup）操作，我们需要将列限制到只有非聚集索引键（ProductKey ,salesorderid）。
1 SET STATISTICS IO ON 2 GO 3 SELECT ProductId,SalesOrderid FROM SalesOrderDetailHeap WHERE productid=707 AND SalesOrderid=43665
如上图所示，只有非聚集索引查找操作，没有键查找（Key lookup）操作了。

参考文章：

http://www.sqlservercentral.com/blogs/practicalsqldba/2013/03/17/sql-server-part-5-explaining-non-clustered-index-on-heap/
查看全文

相关阅读:
GAN对抗神经网络（原理解析）
Wasserstein distance（EM距离）
浅谈KL散度
 深度学习中 Batch Normalization是什么
 Batch Normalization的正确打开方式
 对于梯度消失和梯度爆炸的理解
 [转贴]loadrunner 场景设计-添加Unix、Linux Resources计数器
 Volley（四）—— ImageLoader & NetworkImageView
SQL单表查询
 ifconfig命令详解

原文地址：https://www.cnblogs.com/woodytu/p/4503697.html

索引深入浅出(5/10)：非聚集索引的B树结构在堆表

参考文章：