高级检索
全部 主题 学科 机构 人物 基金
词表扩展: 自动翻译: 模糊检索:
当前位置:首页>
分享到:

基于切分的汉语连续语音识别技术研究
Research of Segmentation Based Chinese Continuous Speech Recognition Technology

连续语音识别作为人机交互的关键技术之一,已取得长足进步.如何将声学、语音学和语言学知识融入到基于统计的连续语音识别系统中,进一步提高其性能,是当前连续语音识别研究的热点.由于端点检测不够精确,连续语音识别中会出现较多的删除错误和插入错误,本文针对此问题,研究了语音的切分技术和搜索算法,实现了一个基于切分知识的汉语连续语音识别系统.主要成果如下:研究了连续语流中男声共振峰的特点,对10名男性8个元音的前4个共振峰进行统计分析,结果显示男性的第二共振峰F2和第三共振峰F3,以及其比值F3/F2更适合作男声单元音的细节辨识.构建了基于隐马尔可夫模型的连续语音识别基线系统,在此基础上,研究了共振峰、LPC、LPCC、MFCC、PLP等特征参数的连续语音识别性能.实验结果表明,考虑人耳听觉特性的倒谱特征更适用于连续语音识别.对识别错误进一步分析发现,切分不准确是造成系统性能下降的主要原因之一.提出了一种基于听觉事件检测的汉语语音声韵母切分方法.首先使用耳蜗滤波器组对语音进行滤波,然后在每个频带上检测对应于能量突变的听觉事件,并分别在不同频率范围对听觉事件进行融合以确定候选边界,最后按照二叉树判决,顺序检测清辅音声母、浊辅音声母、零声母音节和普通韵母.实验结果表明,对8KHz采样的干净语音切分准确率可达到88.9%;对信噪比10dB的语音切分准确率可达到82.9%以上.提出了一种声学层和语言层独立解码的连续语音识别搜索策略.该策略针对切分语段特点,首先在声学层分别构建单音节词法网络和双音节词法网络,进行声学层解码;然后分别采用A*和令牌传递搜索算法进行语言层解码.实验结果表明,声学层采用双音节句法网络,语言层采用令牌传递搜索算法,系统的插入错误和删除错误大幅降低,准确率有较大提高.

作者:
张宝奇
学位授予单位:
解放军信息工程大学
专业名称:
军事情报学
授予学位:
硕士
学位年度:
2010年
导师姓名:
张连海
中图分类号:
TN912.34
关键词:
语音识别;隐马尔可夫模型;共振峰;听觉事件;声韵切分;句法网络;词图搜索算法
原文获取
正在处理中...
该文献暂无原文链接!
该文献暂无参考文献!
该文献暂无引证文献!
相似期刊
相似会议
相似学位
相关机构
正在处理中...
相关专家
正在处理中...
您的浏览历史
正在处理中...
友情提示

作者科研合作关系:

点击图标浏览作者科研合作关系,以及作者相关工作单位、简介和作者主要研究领域、研究方向、发文刊物及参与国家基金项目情况。

主题知识脉络:

点击图标浏览该主题词的知识脉络关系,包括相关主题词、机构、人物和发文刊物等。

关于我们 | 用户反馈 | 用户帮助| 辽ICP备05015110号-2

检索设置


请先确认您的浏览器启用了 cookie,否则无法使用检索设置!  如何启用cookie?

  1. 检索范围

    所有语言  中文  外文

  2. 检索结果每页记录数

    10条  20条  30条

  3. 检索结果排序

    按时间  按相关度  按题名

  4. 结果显示模板

    列表  表格

  5. 检索结果中检索词高亮

    是 

  6. 是否开启检索提示

    是 

  7. 是否开启划词助手

    是 

  8. 是否开启扩展检索

    是 

  9. 是否自动翻译

    是