基于语音识别的机器人控制技术的研究
Research on Control Technology of Robot Based on Speech Recogniton
语音,作为人类最自然的交流工具,是人类获取资源与信息的重要来源.在信息技术高速发展的今天,让计算机能"听懂"人类的语音,是人-机进行沟通的最便捷的形式之一,语音识别就是这样的一门技术.近些年来,语音识别技术一直是计算机应用的热点.同样,机器人技术也逐渐成为现代自动化技术发展的标志之一.因此,将语音识别技术和机器人控制技术相结合,更是体现了当今最高技术上的自动化.本课题利用博创科技的旅行家-Ⅱ号机器人,以实现对机器人的语音控制为目标,针对语音信号的特征参数提取问题、语音识别算法的性能优化问题及机器人运动测试进行探讨研究,具体工作如下:提出了一种新的语音特征参数提取的方法.在传统的基于人耳听觉特性的MFCC特征参数基础上,将其与基于人的发声机理的共振峰参数结合,构成新的语音特征参数(MFCC+共振峰).该方法从语音的发声机理和人耳听觉两方面出发,提取语音参数,此算法较传统方法包含信息量多,准确性高,且抗噪声能力强.针对传统的隐马尔科夫模型训练过程中对初值依赖性强、容易陷入局部最优的缺陷和DTW算法实时性的要求,分别提出了三步混合算法(TSMS)和DTW高效算法.经过仿真实验表明,TSMS算法的适应性更强,收敛速度更快,识别的准确率更高.DTW高效算法能够在满足实时性的前提下,减小计算量.给出两个改进算法的实验测试结果,验证了两者的优势.最后,设计机器人语音控制系统.创建Microsoft Speech SDK程序文件,编写DTW高效算法的端口程序和机器人运动测试程序,并对运动测试结果作了分析和说明.
- 作者:
- 王娜
- 学位授予单位:
- 东北石油大学
- 专业名称:
- 模式识别与智能系统
- 授予学位:
- 硕士
- 学位年度:
- 2011年
- 导师姓名:
- 邵克勇
- 中图分类号:
- TN912.34;TP242
- 关键词:
- 特征参数;语音识别;TSMS;DTW高效算法;机器人控制
- parameters;speech recognition;TSMS;DTW efficient algorithm;robot control