高级检索
全部 主题 学科 机构 人物 基金
词表扩展: 自动翻译: 模糊检索:
当前位置:首页>
分享到:

基于McDiarmid不等式的决策树分类方法研究与应用
Research and Application of Decision Tree Classification Method Based on Mcdiarmid's Inequality

随着信息技术和大数据的不断发展,数据流模型被广泛应用于社会生产和生活的各个领域.因此,数据流的收集和分析就变得至关重要.数据流的爆炸性增长,使得研究者需要更大的内存来存储这些数据流.然而,使用传统的数据挖掘技术很难处理数据流,并且不可能从大量数据流中提取有价值的信息.如今,研究者使用增量决策树方法来处理数据流分类问题,这是挖掘大量数据流中有用信息的方法之一.本文首先对数据流决策树分类方法的相关知识进行概述,包括数据流的定义、概念、特征等.其次介绍了现有的决策树分类方法,主要包括单分类决策树方法和集成分类决策树方法.然后研究基于McDiarmid不等式的数据流决策树分类算法.最后设计实现基于决策树分类方法的城市用户行为分析验证平台.本文的主要贡献如下:(1)首先介绍数据流的概念、特点和处理方式等基本知识.其次,对现阶段用于处理数据流的分类方法,包括决策树、支持向量机、贝叶斯、神经网络、KNN和关联/分类规则进行分析比较.接下来分析数据流决策树分类方法,包括单分类决策树方法和集成分类决策树方法.其中,单分类决策树方法包括快速决策树、快速决策树的衍生算法和其它类型的决策树算法.集成分类决策树方法包括基于Hoeffding不等式的集成分类方法、随机决策树衍生的集成分类方法和其它类型集成分类方法.(2)针对Hoeffding不等式处理数据流时间过长,并且在属性分裂度量方面存在不足等问题.比如信息增益和基尼指数,不能表示为实数值随机变量的和,其中,1≤≤,表示属性数是具有一定分布的实数值随机变量.为了进一步提高分类性能,本文提出了一种基于McDiarmid不等式的数据流决策树分类算法(McDiarmid Decision Tree,McDDT),并研究使用t进行属性分类度量.该算法与经典决策树算法相比,在分类准确率升高或者几乎保持不变的情况下,算法运行时间明显减少,生成决策树的节点数与层数明显降低.(3)本文设计了一种基于McDDT算法的用户到访行为分析验证平台,该平台采用Python语言基于Tkinter框架设计的.主要向用户提供了数据处理、数据分析和结果显示等核心功能,用于实现用户所到行政区的预测分析功能.

作者:
贾涛
学位授予单位:
北方民族大学
专业名称:
计算机技术(专业学位)
授予学位:
硕士
学位年度:
2019年
导师姓名:
韩萌;王生国
中图分类号:
TP311.13;TP181
关键词:
数据流;分类;决策树;Hoeffding不等式;McDiarmid不等式
原文获取
正在处理中...
该文献暂无原文链接!
该文献暂无参考文献!
该文献暂无引证文献!
相似期刊
相似会议
相似学位
相关机构
正在处理中...
相关专家
正在处理中...
您的浏览历史
正在处理中...
友情提示

作者科研合作关系:

点击图标浏览作者科研合作关系,以及作者相关工作单位、简介和作者主要研究领域、研究方向、发文刊物及参与国家基金项目情况。

主题知识脉络:

点击图标浏览该主题词的知识脉络关系,包括相关主题词、机构、人物和发文刊物等。

关于我们 | 用户反馈 | 用户帮助| 辽ICP备05015110号-2

检索设置


请先确认您的浏览器启用了 cookie,否则无法使用检索设置!  如何启用cookie?

  1. 检索范围

    所有语言  中文  外文

  2. 检索结果每页记录数

    10条  20条  30条

  3. 检索结果排序

    按时间  按相关度  按题名

  4. 结果显示模板

    列表  表格

  5. 检索结果中检索词高亮

    是 

  6. 是否开启检索提示

    是 

  7. 是否开启划词助手

    是 

  8. 是否开启扩展检索

    是 

  9. 是否自动翻译

    是