高级检索
全部 主题 学科 机构 人物 基金
词表扩展: 自动翻译: 模糊检索:
当前位置:首页>
分享到:

基于自训练的决策式依存句法分析技术的研究

决策式依存句法分析技术是一种数据驱动的句法分析技术,它采用的是标准的有监督机器学习方法,因此决策式依存句法分析器对有标注数据存在依赖性,也就是当有标注数据充足并且与待标注数据领域匹配时,分析器性能最佳,否则分析器的性能将会下降.针对这一问题,本课题结合自训练这种半监督机器学习方法,提出了一种基于自训练的决策式依存句法分析方法.该方法在决策自信度的基础上利用句型的互异关系选择出少量用原始模型标注出的未标注数据,由此可在有标注数据不充足或者与待测试数据领域不匹配的情况下提升分析器的性能.经典决策式依存句法分析器存在贪婪性,这导致分析结果中的一些错误具有一些共性.本课题根据这些共性定义了两种根偏置子树,并提出了基于根偏置子树的依存句法分析方法对句子中的根偏置子树进行预分析,之后再分析预分析后的句子.实验结果表明,基于根偏置子树的依存句法分析方法可以保证句子整体分析错误不增加的情况下提升根偏置子树的分析正确率,以此提升分析器的性能.其次本课题在经典决策式依存句法分析器的基础上提出了基于自训练的决策式依存句法分析方法,该方法首先使用原始有标注数据对无标注数据进行标注,然后利用本文提出的基于自信度的数据选择策略和在此基础上提出的基于句型互异程度的数据选择策略选择出高质量并且句子结构相对多样的数据加入原始有标注数据,之后重新训练模型,最后用新模型对待标注数据进行标注.实验结果表明在有标注数据缺乏或者与测试数据领域不匹配时,基于自训练的决策式依存句法分析器比原始分析器具有更好的性能和领域适应能力,并且本文提出的两种数据选择策略均比随机选择拥有更好的效果.最后,本课题设计并实现了基于自训练的决策式依存句法分析器.该系统支持使用标准的有监督机器学习方法训练依存句法分析模型,同样支持自训练方式的依存句法分析模型训练,还支持决策式依存句法分析.

作者:
夏大伟
学位授予单位:
沈阳航空航天大学
专业名称:
计算机技术
授予学位:
硕士
学位年度:
2015年
导师姓名:
张桂平
中图分类号:
TP391.1
关键词:
自训练;决策式依存句法分析;自信度;依存句法分析;半监督机器学习
原文获取
正在处理中...
该文献暂无原文链接!
该文献暂无参考文献!
该文献暂无引证文献!
相似期刊
相似会议
相似学位
相关机构
正在处理中...
相关专家
正在处理中...
您的浏览历史
正在处理中...
友情提示

作者科研合作关系:

点击图标浏览作者科研合作关系,以及作者相关工作单位、简介和作者主要研究领域、研究方向、发文刊物及参与国家基金项目情况。

主题知识脉络:

点击图标浏览该主题词的知识脉络关系,包括相关主题词、机构、人物和发文刊物等。

关于我们 | 用户反馈 | 用户帮助| 辽ICP备05015110号-2

检索设置


请先确认您的浏览器启用了 cookie,否则无法使用检索设置!  如何启用cookie?

  1. 检索范围

    所有语言  中文  外文

  2. 检索结果每页记录数

    10条  20条  30条

  3. 检索结果排序

    按时间  按相关度  按题名

  4. 结果显示模板

    列表  表格

  5. 检索结果中检索词高亮

    是 

  6. 是否开启检索提示

    是 

  7. 是否开启划词助手

    是 

  8. 是否开启扩展检索

    是 

  9. 是否自动翻译

    是