面向时序数据的数据挖掘算法研究与应用
Research and Application on Data Mining Algorithm for Time-Series Data
时序数据是随着时间连续变化的数据,因而其反映的大都是某个待观察过程在一定时期内的状态或表现.其研究的目的主要是以下两个方面:其一是学习待观察过程过去的行为特征;其二是预测未来该过程的可能状态或表现.虽然对这两项工作已经有大量的研究和文献,提出了很多很实用的解决办法.但由于这两项工作都与实际问题有着很大的关系,实际应用中总是还有大量的提升空间. 本文综述了国内外数据挖掘研究的发展,介绍了相关概念,讨论了基于时序数据的数据挖掘算法,其中重点分析了线性回归算法、时间序列算法以及相似查询算法;经过对相关数据的抽取、转换和加载设计完成了数据仓库的模型建立;最后设计实现了基于时序数据的数据挖掘平台;并且在此平台上分别进行了基于一元线性回归算法、多元线性回归算法和时间序列算法的人口数以及经济数据的预测测试.通过历年累计数据实现了数据预测,预测结果和真实值达到了较好的吻合. 预测结果表明,本文完成的基于数据挖掘的预测平台具有一定的应用意义,达到了设计要求,验证了本文算法的正确性和有效性.
- 作者:
- 田威
- 学位授予单位:
- 信息科学与工程学院
- 专业名称:
- 计算机软件与理论学科
- 授予学位:
- 硕士
- 学位年度:
- 2008年
- 导师姓名:
- 刘纪红
- 关键词:
- 数据挖掘;时序数据;线性回归data mining;time-series data;linear regression
-