- 相关推荐
视频帧中的文本检测与提取技术
随着计算机和通信技术、宽带网络技术、音视频压缩技术以及计算机硬件技术的发展,图像和视频中的文本信息对索引、检索及高层语义的自动理解等具有重要价值。本文主要研究如何从视频帧中检测、提取与识别人工添加的文本信息。论文的主要工作如下: 首先,根据文本的特征以及目前存在视频图像的文本定位和提取算法,实现了一种基于边缘检测的文本定位方法。实现主要流程包括:对选取的视频帧图像进行灰度化处理、边缘检测、边缘图像二值化及数学形态学操作,最后定位文本区域。实验表明该方法实现简单,并且可以定位出大部分的文本区域,但当图像或视频帧中背景本身包含了丰富的边缘信息时,则定位文本区域就不够准确。 其次,对定位好的文本区域进行提取与识别,本文应用基于阈值分割方法来提取文本。在处理简单或者单一背景色的文字图像时,使用经典的阈值分割算法中的最大类间方差法(OTSU),该方法计算简单、稳定有效。在复杂背景下提取文字时,本文使用了局部自适应的阈值化方法。经过实验测试,得到了很好的分割效果。 最后,对提取出的文本进行去噪声等处理,最大限度地去除文本的背景,为OCR识别系统提供完整清晰的二值输入文本图像。经“尚书七号”文字识别软件对文本图像进行识别后,结果证明文字的正确识别率能达到80%左右。
【视频帧中的文本检测与提取技术】相关文章:
入侵检测在网络安全中的应用问题论文04-28
多媒体技术在体育教学中的运用06-15
信息技术在美术教学中的应用05-30
现代教育技术在美术教学中的运用09-21
谈电子技术中单元电路的设计08-06
现代教育技术在物理教学中的应用论文04-21
谈水利工程中岩石基础灌浆技术08-05