牛骨文教育服务平台(让学习变的简单)
博文笔记

MongoDB中索引的创建和使用详解

创建时间:2013-01-04 投稿人: 浏览次数:21675

from: http://database.51cto.com/art/201107/277116.htm


索引通常能够极大的提高查询的效率。在系统中使用查询时,应该考虑建立相关的索引。在MongoDB中创建索引相对比较容易。

MongoDB中的索引在概念上和大多数关系型数据库如MySQL是一样的。当你在某种情况下需要在MySQL中建立索引,这样的情景同样适合于MongoDB。

基本操作

索引是一种数据结构,他搜集一个集合中文档特定字段的值。MongoDB的查询优化器能够使用这种数据结构来快速的对集合(collection)中的文档(collection)进行寻找和排序.准确来说,这些索引是通过B-Tree索引来实现的。

在命令行中,可以通过调用ensureIndex()函数来建立索引,该函数指定一个到多个需要索引的字段。沿用在前面的随笔中的例子,我们再things集合中的j字段上建立索引:

  1. > db.things.ensureIndex({j:1}) 

EnsureIndex()函数自是在索引不存在的情况下才会创建。

一旦集合在某一个字段上建立索引后,对该字段的随机查询的访问速度会很快。如果没有索引,MongoDB会在遍历所有的键值对,然后去对应检查相关的字段。

  1. > db.things.find({j:2}); //在建立了索引的字段上查询,速度快  
  2.  
  3. { "_id" : ObjectId("4e24433dcac1e3490b9033be"), "x" : 4, "j" : 2 }  
  4.  
  5. > db.things.find({x:3});//在未建立索引的字段上查询,需要逐个字段匹配,速度慢  
  6.  
  7. { "_id" : ObjectId("4e244315cac1e3490b9033bc"), "x" : 3 } 

通过在命令行中输入getIndexs()能够查看当前集合中的所有索引。

  1. > db.things.getIndexes()  
  2.  
  3. [  
  4.  
  5. {  
  6.  
  7. "name" : "_id_",  
  8.  
  9. "ns" : "things.things",  
  10.  
  11. "key" : {  
  12.  
  13. "_id" : 1  
  14.  
  15. },  
  16.  
  17. "v" : 0  
  18.  
  19. },  
  20.  
  21. {  
  22.  
  23. "_id" : ObjectId("4e244382cac1e3490b9033d0  
  24.  
  25. "ns" : "things.things",  
  26.  
  27. "key" : {  
  28.  
  29. "j" : 1  
  30.  
  31. },  
  32.  
  33. "name" : "j_1",  
  34.  
  35. "v" : 0  
  36.  
  37. }  
  38.  

通过db.system.indexes.find()能够返回当前数据库中的所有索引

  1. > db.system.indexes.find()  
  2.  
  3. { "name" : "_id_", "ns" : "things.things", "key" : { "_id" : 1 }, "v" : 0 }  
  4.  
  5. { "_id" : ObjectId("4e244382cac1e3490b9033d0"), "ns" : "things.things", "key" :{ "j" : 1 }, "name" : "j_1", "v" : 0 } 

默认索引

对于每一个集合(除了capped集合),默认会在_id字段上创建索引,而且这个特别的索引不能删除。_id字段是强制唯一的,由数据库维护。

嵌套关键字

在MongoDB中,甚至能够在一个嵌入的文档上(embedded)建立索引.

  1. > db.things.ensureIndex({"address.city":1}) 

文档作为索引

任何类型,包括文档(document)都能作为索引:

  1. > db.factories.insert({name:"xyz",metro:{city:"New York",state:"NY"}});  
  2.  
  3. > db.factories.ensureIndex({metro:1});  
  4.  
  5. > db.factories.find({metro:{city:"New York",state:"NY"}});//能够利用索引进行查询  
  6.  
  7. { "_id" : ObjectId("4e244744cac1e3490b9033d2"), "name" : "xyz", "metro" : < 
  8.  
  9. { "city" : "New York", "state" : "NY" } }  
  10.  
  11. > db.factories.find({metro:{$gte:{city:"New York"}}});//能够利用索引进行查询  
  12.  
  13. { "_id" : ObjectId("4e244744cac1e3490b9033d2"), "name" : "xyz", "metro" : { "city" : "New York", "state" : "NY" } }  
  14.  
  15. > db.factories.find({metro:{state:"NY",city:"New York"}})//不能够返回结果,字段的顺序不对 

创建文档索引的一个替代方法是创建复合索引,例如:

  1. > db.factories.ensureIndex({"metro.city":1,"metro.state":1})  
  2.  
  3. > db.factories.find({"metro.city":"New York","metro.state":"NY"});  
  4.  
  5. { "_id" : ObjectId("4e244744cac1e3490b9033d2"), "name" : "xyz", "metro" : { "city" : "New York", "state" : "NY" } }  
  6.  
  7. > db.factories.find({"metro.city":"New York"});  
  8.  
  9. { "_id" : ObjectId("4e244744cac1e3490b9033d2"), "name" : "xyz", "metro" : { "city" : "New York", "state" : "NY" } }  
  10.  
  11. > db.factories.find().sort({"metro.city":1,"New York":1});  
  12.  
  13. { "_id" : ObjectId("4e244744cac1e3490b9033d2"), "name" : "xyz", "metro" : { "city" : "New York", "state" : "NY" } }  
  14.  
  15. > db.factories.find().sort({"metro.city":1});  
  16.  
  17. { "_id" : ObjectId("4e244744cac1e3490b9033d2"), "name" : "xyz", "metro" : { "city" : "New York", "state" : "NY" } } 

组合关键字索引

除了基本的以单个关键字作为索引外,MongoDB也支持多个关键字的组合索引,和基本的索引一样,也是用ensureIndex()函数,该函数可以指定多个键。

  1. > db.things.ensureIndex({j:1,name:-1}) 

当创建索引时,键后面的数字表明了索引的方向,取值为1或者-1,1表示升序,-1表示降序。升序或者降序在随机访问的时候关系不大,当时在做排序或者范围查询的时候就很重要了。

如果在建立了a,b,c这样一个复合索引,那么你可以在a,A,b和a,b,c上使用索引查询。



稀疏索引

和稀疏矩阵类似,稀疏索引就是索引至包含被索引字段的文档。

任何一个稀疏的缺失某一个字段的文档将不会存储在索引中,之所以称之为稀疏索引就是说缺失字段的文档的值会丢失。

稀疏索引的创建和完全索引的创建没有什么不同。使用稀疏索引进行查询的时候,某些由于缺失了字段的文档记录可能不会被返回,这是由于稀疏索引子返回被索引了的字段。可能比较难以理解,不过看几个例子就好理解了。

  1. > db.people.ensureIndex({title:1},{sparse:true}) //在title字段上建立稀疏索引  
  2.  
  3. > db.people.save({name:"Jim"})  
  4.  
  5. > db.people.save({name:"yang",title:"prince"})  
  6.  
  7. > db.people.find();  
  8.  
  9. { "_id" : ObjectId("4e244dc5cac1e3490b9033d7"), "name" : "Jim" }  
  10.  
  11. { "_id" : ObjectId("4e244debcac1e3490b9033d8"), "name" : "yang", "title" : "prince" }  
  12.  
  13. > db.people.find().sort({title:1})//自有包含有索引字段的记录才被返回  
  14.  
  15. { "_id" : ObjectId("4e244debcac1e3490b9033d8"), "name" : "yang", "title" : "prince" }  
  16.  
  17. > db.people.dropIndex({title:1})//删除稀疏索引之后,所有的记录均显示  
  18.  
  19. { "nIndexesWas" : 2, "ok" : 1 }  
  20.  
  21. > db.people.find().sort({title:1})  
声明:该文观点仅代表作者本人,牛骨文系教育信息发布平台,牛骨文仅提供信息存储空间服务。