高级检索
全部 主题 学科 机构 人物 基金
词表扩展: 自动翻译: 模糊检索:
当前位置:首页>
分享到:

基于最优分割策略的高性能文本分类方法
A High Performance Text Categorization Method Based on Optimal Division Strategy

进入九十年代以来,互联网得到了极大的发展,产生了海量的非结构化和半结构化文本信息.如何对之进行有效的组织和管理,使用户能方便、准确地查找到所需要的信息,是信息处理的一大目标.基于人工智能技术的自动文本分类已成为信息处理的关键技术,它能根据文本的语义将大量的文本自动分类,有效地解决有关文本信息的组织、管理等关键问题.文本分类的方法很多,典型的有朴素贝叶斯分类器、基于向量空间模型的分类器、基于实例的分类器和用支持向量机建立的分类器等,樊兴华教授等近年来提出了一种基于两步策略的高性能文本分类方法,该方法基于文本模糊区间和文本分割线,但是,该方法还没有深入解决如下问题:①理论上的文本分割线是否就是最优的文本分割线呢?②如果不是,能否设计一种算法或者利用某一经典的算法来寻求最优文本分割线呢?本文提出了一种基于最优分割策略的文本分类方法,该方法将朴素贝叶斯分类器变换为在二维空间中的一条分割线,在分割线临近的文本分类不可靠区间内,利用最优分割线搜索算法寻求最优文本分割线,从而使分类器达到最佳性能.在由12600篇文本构成的中文语料数据集上的实验结果表明,该方法具有较高的分类性能和效率,精确率、召回率和F1-measure值分别达到97.98%,91.05%和94.39%.

作者:
万狄飞
学位授予单位:
重庆邮电大学
专业名称:
计算机软件与理论
授予学位:
硕士
学位年度:
2008年
导师姓名:
王国胤;樊兴华
中图分类号:
TP18
关键词:
文本分类;遗传算法;最优分割线;文本二维空间;朴素贝叶斯分类器
基金项目:
国家自然基金
原文获取
正在处理中...
该文献暂无原文链接!
该文献暂无参考文献!
该文献暂无引证文献!
相似期刊
相似会议
相似学位
相关机构
正在处理中...
相关专家
正在处理中...
您的浏览历史
正在处理中...
友情提示

作者科研合作关系:

点击图标浏览作者科研合作关系,以及作者相关工作单位、简介和作者主要研究领域、研究方向、发文刊物及参与国家基金项目情况。

主题知识脉络:

点击图标浏览该主题词的知识脉络关系,包括相关主题词、机构、人物和发文刊物等。

关于我们 | 用户反馈 | 用户帮助| 辽ICP备05015110号-2

检索设置


请先确认您的浏览器启用了 cookie,否则无法使用检索设置!  如何启用cookie?

  1. 检索范围

    所有语言  中文  外文

  2. 检索结果每页记录数

    10条  20条  30条

  3. 检索结果排序

    按时间  按相关度  按题名

  4. 结果显示模板

    列表  表格

  5. 检索结果中检索词高亮

    是 

  6. 是否开启检索提示

    是 

  7. 是否开启划词助手

    是 

  8. 是否开启扩展检索

    是 

  9. 是否自动翻译

    是