MongoDB索引机制研究
Research on MongoDB Indexing Mechanism
MongoDB作为一种完全开源面向文档型数据存储的数据库,以及其在海量非结构化数据处理上的良好表现得到了广泛关注和应用.尤其在海量信息存储、数据查询、分布式处理等方面的性能远远超过了传统关系数据库,但在MongoDB数据库中借助索引进行数据对象查询,在海量数据压力下,也势必影响系统查询性能.因此,研究MongoDB存储机制和索引机制关键技术,提升MongoDB的索引查询能力,对大数据时代应用系统的发展和性能优化具有重要推动作用.论文以MongoDB作为研究对象,对MongoDB的索引和存储机制进行了深入研究.重点分析MongoDB索引机制的部分源代码,针对现有索引及查询机制存在的查询效率低的问题,研究了优化的索引查询机制,主要工作如下:1.为进一步优化MongoDB索引查询性能,提出了基于PAM优化算法索引的分层索引存储机制.该机制将索引进行冷热聚类区分,采用基于Redis的存储分层策略,尽量让热索引存在于内存中,从而提升查询性能.通过与原有索引机制进行实验对比,验证了基于PAM算法的分层索引存储机制可以有效减少查询过程中系统对磁盘的I/O操作,提高索引查询效率.2.在1中提出的索引分层存储机制基础上,基于K近邻算法对系统索引进行热度预测,提出基于热度预测的索引动态更新机制.该机制对新建和更新索引进行热度预测并且动态分层存储.并对MongoDB原有索引存储机制、基于PAM优化算法的索引分层存储机制和基于热度预测的索引动态更新机制,分别对索引的热度预测正确率和系统查询响应时间进行实验对比,实验结果表明,改进机制能够有效提升热索引在Redis中的命中率,进一步提升MongoDB的数据查询效率.论文研究工作表明,通过研究MongoDB的存储及索引机制,对索引进行分类及预测,并建立基于Redis的存储分层机制,可以有效提高索引查询效率,提升系统性能.
- 作者:
- 梁云柯
- 学位授予单位:
- 重庆邮电大学
- 专业名称:
- 计算机技术
- 授予学位:
- 硕士
- 学位年度:
- 2016年
- 导师姓名:
- 熊安萍
- 中图分类号:
- TP311.13
- 关键词:
- MongoDB;冷热索引;Redis;分层存储;热度预测
- MongoDB; Hot and cold Index; Redis; Hierarchical Storage; Heat Prediction;