基于MATLAB的身份证号码识别算法
近年来,随着图像处理和模式识别技术的成熟发展,证件识别已成为一门具有较大发展前景的新兴技术,身份证号码自动识别技术也就应运而生.它有效地解决了身份证号码的录入问题,大大提高了工作效率.并且,随着网络技术和数据库技术的发展,识别结果可以根据需要进行管理,信息的查询与管理也越来越方便快捷.可见,采用身份证号码自动识别技术代替手工录入,具有很重要的现实意义及广阔的应用前景.
本文的身份证号码自动识别系统是在环形光源照射下使用摄像头采集身份证图像,然后对图像进行分析处理.采集图像数据的好坏,直接影响到识别效果,因此,必须综合考虑各方面的因素.为了尽可能获得最佳图像数据,论文使用摄像头和木架设计了一个类似灯箱结构的装置.装置采用手工制作,由均匀光照子系统和采集处理子系统两部分构成,主要的应用部件包括220V环形灯管(10W)、镇流器、硬纸板、白色灯罩、极速V5高清摄像头、黑色剪纸、转轴、放置身份证和固定摄像头与光源的木板支架等.装置通过摄像头的USB线与电脑相连接,可实现身份证图像实时采集,获得稳定清晰的身份证图像.论文利用此装置最终获得50张稳定清晰的身份证图像.
本文的软件系统是基于MATLAB的身份证号码识别算法,首先综合运用图像处理和分析技术,并针对获取的身份证图像的自身特点(存在强烈的底纹以及激光防伪标识造成的干扰)对身份证图片进行简单的灰度化,选用多种二值化算法,完成灰度图像到二值化文本的转化,并对选用的二值化算法进行比较.然后对身份证号码区域进行分割,去噪.本文分别运用中值滤波算法和基于数学形态学的膨胀、腐蚀对得到的身份证号码区域进行去噪.最后对身份证图像进行归一化和细化处理,针对身份证号码自身特点,提取其六个特征,即整体上下比、整体左右比、上部左右比、左部上下比、上部上下比、欧拉数.采集50个数字字符,利用其中的30个数字字符进行训练,20个数字字符进行测试,设计了混合分类器、K近邻分类器两个分类器.在混合分类器中,根据欧拉数值,将数字8,数字0、6、9,数字1、2、3、4、5、7分成三类,再用整体上下比、整体左右比和上部左右比三个特征,由最近邻原理区分它们,求出识别率是70%.在K近邻分类器中,由于欧拉数随意性较大,舍弃了它,利用整体上下比、整体左右比、上部左右比和上部上下比四个特征,求出识别率是97%.
- 作者:
- 刘清霞
- 学位授予单位:
- 华北水利水电学院
- 专业名称:
- 模式识别与智能系统
- 授予学位:
- 硕士
- 学位年度:
- 2012年
- 导师姓名:
- 邱道尹
- 关键词:
- 身份证号码自动识别技术;数字图像处理;MATLAB算法;运行管理
-