zoukankan      html  css  js  c++  java
  • SQL Server 2008中如何为XML字段建立索引

         SQL Server中的XML索引分为两类:主XML 索引和辅助XML索引。其中辅助XML索引又分为:PATH 辅助XML索引,VALUE 辅助XML索引,PROPERTY辅助XML索引。

          创建XML索引的语法示例如下:

    1. create table XMLTable(Id int primary key, XMLCol xml);  
    2. go  
    3. --XML主索引  
    4. create primary xml index IPXML_XMLTable_XMLCol on XMLTable(XMLCol);  
    5. --XML路径辅助索引  
    6. create xml index IXML_XMLTable_XMLCol_Path on XMLTable(XMLCol)  
    7. using xml index IPXML_XMLTable_XMLCol for path  
    8. --XML属性辅助索引  
    9. create xml index IXML_XMLTable_XMLCol_Property on XMLTable(XMLCol)  
    10. using xml index IPXML_XMLTable_XMLCol for Property  
    11. --XML内容辅助索引  
    12. create xml index IXML_XMLTable_XMLCol_value on XMLTable(XMLCol)  
    13. using xml index IPXML_XMLTable_XMLCol for value  

    需要注意是的,建立XML索引的表必须有主键。

    建立索引的好处是提高查询效率,坏处是增加存储空间。下面结合实例,说明一下:

    1.首先建立测试表,在SSMS中执行如下SQL语句create table XMLTable(Id int primary key, XMLCol xml);建表。

    2.下面的程序是给表添加60万条数据,方便测试性能。至于为什么用程序添加而不是用insert语句,请参见我的另一篇博客:SQL Server 批量插入数据的两种方法http://blog.csdn.net/tjvictor/archive/2009/07/18/4360030.aspx

    1. static void Main(string[] args)  
    2. {  
    3.     DataTable dt = GetTableSchema();  
    4.     for (int count = 1; count <= 600000; count++)  
    5.     {  
    6.         DataRow r = dt.NewRow();  
    7.         r[0] = count;  
    8.         r[1] = GetPropertyXML();  
    9.         dt.Rows.Add(r);  
    10.     }  
    11.     BulkToDB(dt);  
    12.   
    13.     Console.WriteLine("finished");  
    14.     Console.ReadLine();  
    15. }  
    16.   
    17. public static void BulkToDB(DataTable dt)  
    18. {  
    19.     SqlConnection sqlConn = new SqlConnection(  
    20.         ConfigurationManager.ConnectionStrings["ConnStr1"].ConnectionString);  
    21.   
    22.     SqlBulkCopy sqlBulkCopy = new SqlBulkCopy(sqlConn);  
    23.     sqlBulkCopy.BulkCopyTimeout = 0;  
    24.     sqlBulkCopy.BatchSize = dt.Rows.Count;  
    25.     sqlBulkCopy.DestinationTableName = "XMLTable";  
    26.   
    27.     try  
    28.     {  
    29.         sqlConn.Open();  
    30.         if (dt != null && dt.Rows.Count != 0)  
    31.         {  
    32.             sqlBulkCopy.WriteToServer(dt);  
    33.         }  
    34.     }  
    35.     catch (Exception ex)  
    36.     {  
    37.         throw ex;  
    38.     }  
    39.     finally  
    40.     {  
    41.         sqlConn.Close();  
    42.     }  
    43. }  
    44.   
    45. public static DataTable GetTableSchema()  
    46. {  
    47.     DataTable dt = new DataTable();  
    48.     dt.Columns.AddRange(new DataColumn[]{  
    49.         new DataColumn("Id",typeof(int)),  
    50.         new DataColumn("XMLCol",typeof(string))});  
    51.     return dt;  
    52. }  
    53.   
    54. public static int GetRandRange(int start, int end)  
    55. {  
    56.     Random random = new Random(Guid.NewGuid().GetHashCode());  
    57.     return random.Next(start, end);  
    58. }  
    59.   
    60. public static string GetPropertyXML()  
    61. {  
    62.     StringBuilder buffer = new StringBuilder();  
    63.     buffer.AppendLine("<TJVICTOR>");  
    64.   
    65.     for (int count = 0; count < GetRandRange(1, 10); count++)  
    66.     {  
    67.         int baseNum = GetRandRange(1, 100);  
    68.         buffer.AppendLine(string.Format("<Item{0} v=/"Property{0}/">Value{0}</Item{0}>", baseNum));  
    69.     }  
    70.   
    71.     buffer.AppendLine("</TJVICTOR>");  
    72.     return buffer.ToString();  
    73. }  

    3.执行一条查询语句,注意它的执行时间和执行计划:

    select Id from XMLTable
    where XMLCol.exist('/TJVICTOR/Item3')=1

    由于机器配置不同,所以执行时间不会完全一样,这里只给出执行计划,以供参考:

    不带XML索引的执行计划

    所有时间都花在了Table Valued Function上,而且还是clustered index scan。

    4.给这个表的XML字段加上索引。

    1. --XML主索引  
    2. create primary xml index IPXML_XMLTable_XMLCol on XMLTable(XMLCol);  
    3. --XML路径辅助索引  
    4. create xml index IXML_XMLTable_XMLCol_Path on XMLTable(XMLCol)  
    5. using xml index IPXML_XMLTable_XMLCol for path  
    6. --XML属性辅助索引  
    7. create xml index IXML_XMLTable_XMLCol_Property on XMLTable(XMLCol)  
    8. using xml index IPXML_XMLTable_XMLCol for Property  
    9. --XML内容辅助索引  
    10. create xml index IXML_XMLTable_XMLCol_value on XMLTable(XMLCol)  
    11. using xml index IPXML_XMLTable_XMLCol for value  

    注意:由于我们表中已经有60万条数据,所以建索引时间会很久,而且会占用大量内存和磁盘,本人就花费了10分钟左右,占了1G内存,和1.3G磁盘。请大家建索引时注意自己的硬盘空间,或者修改前面插入数据的程序,少插入一些数据。

    5.重新执行上面的Sql语句:

    select Id from XMLTable
    where XMLCol.exist('/TJVICTOR/Item3')=1

    你会发现,瞬间就出结果了,下面是执行计划,用到了XML index seek。

    带XML索引的执行计划

    总结:建立XML索引后,查询效率会大大提高,经过本人的测试,xml.exist的执行效率最高,基本上提高了一个数据级,其它语句比如xml.query,xml.value等,查询速度提高了一倍左右,但总体不是太理想。但同时也发现,xml索引太占空间,比如上面的60万条记录吧,空间占用比例如下:

    name       rows           reserved             data              index_size        unused
    XMLTable 600000      1479688 KB        160952 KB    1318184 KB      552 KB

  • 相关阅读:
    java的类继承(与c++对比)
    java的数据类型、自动拆装箱、字面量
    java中关键字static和final
    JVM之JIT
    java之JIT(Just in time)
    栈和堆
    C++中vector的使用
    canvas
    ajax笔记
    CSS笔记
  • 原文地址:https://www.cnblogs.com/cxd4321/p/2175401.html
Copyright © 2011-2022 走看看