- 相关推荐
基于图像的OMR技术的实现
摘要:在分析OMR与OCR的应用特点后,提出了基于图像的OMR方式。详细讨论了该方法的硬件设计和工作原理,并在软件处理方面着重介绍了倾斜校正和图像分割。它具有对纸张质量要求低和识别准确度高等特点。目前,许多文档是以纸质文档的形式存在,例如银行票据、税务报表、标准化考试中的机读卡、人口普查表、彩标投注单、选票、定货单等。而纸质文档不便于保存、检索、统计和修改。将这些信息录入计算机是一件非常繁琐的事情。长期以来人们通过键盘手工输入,不但费时费力且容易出错。在实时性要求较高的场合(如选举中的统计选票)自动、快速、准确地处理文档显得尤为重要。因此,对这些文档进行计算机自动录入具有重要的实现意义。
计算机自动录入是解决这个同瓶颈的关键所在。其中,光学字符识别OCR(Optical Character Recognition)和光学标记识别OMR(Optical Mark Recognition)是解决信号自动录入的有效方法。它们利用光学方法将信息录入到计算机并进行识别处理,能极大地提高数据信息的采集速度,便于计算机存储、管理与检索。
1 OCR与OMR
(1)OCR的工作原理
OCR首先将要识别的文字和图像扫描进计算机,然后进行图像的预处理,再抽取字符特片进行识别,转变为计算机能够识别的字符信息。图像预处理包括去除噪声、歪斜校画龙点睛、图像分割、平滑及规范化等。其中图像分割是一个重要的步骤,它的作用是将要识别的单个字符的图像找到并分割出来。OCR技术主要应用于文字图像识别及处理,例如用于印刷体和限制手写体字符的识别。OCR技术已成为大规模数据录入的首选方案,它将随着计算机技术的发展而更加成熟。
(2)OMR的工作原理
OMR识别“涂点”上有无标记两种状态。“涂点”就是信息卡上可以涂写标记的地址。“涂点”所代表的含义可以事先定义,可以代表一个阿拉伯数字,也可以表示一个英文字母或符号。OMR技术快速简单,识别率高且成本低,广泛应用于标准化考虑自动阅卷、各类调查问卷的统计、选举结果的统计等,是自动识别领域中应用较多的一种方法。
2 基于图像的OMR技术
目前OMR一般采用光电对管阅读技术。识别用的器件是半导体发光管及光敏管。发光管是光源器件,由它发出的光照射到“涂点”上。光敏管是接收器件,接收来自“涂点”位置的反射光。因为涂有标记的地方反光弱,未涂标记的地方反光强,所以光敏管接收到的光信号强度不同。不同强度的光信号可以代表有无标记两种状态。将“涂点”位置处的发光管和光敏这组成一只电眼,可识别一个涂点。若干个电眼排列起来组成光电头可完成对一排涂点的识别。
该方法实现应用中有如下限制:信息卡上的“涂点”要与电眼完全对齐,即信息卡在录入时不能倾斜;信息卡不能折皱;纸张质量、印刷技术要求高;填写标记要规范,否则就要影响识别结果。实际应用中,信息卡在录入时由于走纸机构机械误差而略有倾斜,会造成识别出错。
OCR由于采用了图像处理技术,信息卡在录入时的倾斜能自动校正,保证录入的高精度,也能处理略有折皱的信息卡。因此,OCR对所用纸张的质量、印刷技术要求不高,降低了运行成本。同时可以保留填写的原始图像备查,进行复核或重新识别。
在借鉴OCR优点的基础上,笔者在课题《彩标阅读及识别系统》中采用了基于图像的OMR技术。所谓基于图像的OMR技术,就是将信息卡经光电变换,形成二值化图像;再经歪斜校正、图像分割,对分割出的小块图像(含“涂点”)中的黑点数进行计数。若大于某个阈值,就认为有标记,否则就没有标记,从而完成了标记识别。相对OCR而言,它省去了最耗时的字符特征抽取步骤。
3 硬件组成
本系统框图如图1所示。
(1)图像传感器
采用国产的CIS(Contact Image Sensor)图像传感器,其光学分辨率比CCD略低,但是其驱动电路、光学系统和机械结构却比CCD简单。光学系统中采用特殊光源实现光学滤波,消除或减轻了信息卡背景信息对分割、识别的影响。工作时,由CPLD(Complex Programable Logic Device)产生一个周期性的同步脉冲SYN引导每次扫描,时钟信号CLK在移动寄存器的作用下,对CIS内的像元依次进行扫描,像元上的光电信号串行输出。
(2)走纸控制
输入的信息卡通过光学系统成像在图像传感器的光敏面上,在CPLD器件产生的扫描信号的驱动下,图像传感器对信息卡进行横向自扫描;步进电机驱动输纸机构使信息卡纵向运行,从而实现了信息卡的二维扫描。
(3)模拟信号处理
模拟信号处理要考虑信息卡颜色的深浅、字迹的轻重和光强均匀度的变化等引起的脉冲幅度的变化。在光电变换中,对信号幅值影响较大的是:光束照射在光敏面上,光强的不均匀性及波动影响表现为白电平浮动对比度的变化也会引起信号幅值的较大起伏。处理的好坏直接影响到采集图像的质量。其过程为:CIS图像传感器摄取的原始图像信号,经放大、采样保持及滤波、对消、浮动阈值及二值化等一系列处理,消除或减轻了信息卡背景明暗变化、光源变化、开关噪声、高低频干扰等对系统的影响,获得高质量的二值化信号。
(4)数字信号处理
采用A、B两块大容量的SRAM轮流工作在读或写状态。合并二值化的信号,同时为了加快数据采集的速度,每次将16位的串行信号转换为2个字节的并行数据。在标志寄存器的控制下,将信号暂时写入A中,同时计算机通过16位ISA总线从B中取数据。在下一周期,二值化信号写入B中,计算机通过16位ISA总线从A中取数据。这样就保证数据传输的高效性。
(5)逻辑控制
整个系统的逻辑控制采用La
【基于图像的OMR技术的实现】相关文章:
基于minigui的网真机界面的实现08-05
基于军网的雷达远程诊断技术研究08-10
基于分组技术的下一代光传送网05-29
企业知识管理的实现技术和工具的电商论文05-02
医学图像领域中数字图像处理的应用论文04-19
交-交变频技术实现感应电机的重载起动05-28
基于工业机器人的自动化生产技术研究论文04-14
谈地理图像投影导学法08-21
试析基于胜任素质的薪酬模式构建01-03
基于战略治理的企业环境风险研究08-28