华侨大学信息科学与工程学院, 福建 厦门 361021
光学字符识别(OCR)难以针对图像中某些特定文本进行识别,尤其在实际场景中,识别结果通常会包含大量噪声文本。针对这一问题,提出一种基于循环神经网络的双向长短时记忆-条件随机场(BLSTM-CRF)模型。首先利用BLSTM网络捕获OCR识别结果中序列的上下文信息,得到特征序列;然后结合CRF建立模型特征与标签的关系,进行标签预测,通过标签即可得到特定文本。实验结果表明,该方法在场景图像数据集YNIDREAL上可以达到88.52%的准确率,相较于CRF模型,准确率提高了16.39个百分点,证明了本方法的可行性和稳健性。
机器视觉 特定文本抽取 光学字符识别 双向长短时记忆网络 条件随机场 激光与光电子学进展
2019, 56(24): 241501
提出了一种人民币光学字符识别 (OCR)过程中号码区域快速定位的新方法。算法首先利用固定阈值法对纸币图像进行二值化, 然后从二值纸币图像的左边缘和下边缘选取一定数目的样本点, 根据非磨损残缺区域两边缘上向量内积为零的特性, 筛选出位于边缘非残缺区域内的样本点, 从而排除边缘磨损残缺的干扰。再根据这些样本点用最小二乘法拟合直线, 以确定纸币的倾斜角和左下角点坐标。最后对图像做旋转变换, 同时根据旋转公式得到纸币图像矫正后左下角点的坐标, 并以角点为起点偏移固定距离提取出号码区域, 这使得提取号码区域时间开销在微秒级, 图像矫正与号码定位几近同时完成。实验结果表明, 该方法具有较好的鲁棒性和较高的时间效率, 在纸币号码识别系统中具有很好的应用前景。
光学字符识别 最小二乘法 区域定位 图像矫正 OCR least square method region location image correction
提出了一种新的基于统计与模糊隶属度的光学字符特征提取方法,可以快速准确地识别受噪声污染的光学字符。相比传统算法,本文方法的特征空间区分度更高,最小类间距离扩大33.2%以上。应用在径向基函数(RadicalBasis Function,RBF)神经网络中,在字体字号变化且有背景噪声污染的影响下,识别率高达99%以上,且相比直方图投影法提速75%。理论分析与实验结果表明,与传统方法相比,该算法抗噪能力更强、模式区分度更高、时空复杂度更低,更简约、更全面地覆盖了字符的特征,应用范围广。已应用于实际系统,取得很好的实验结果。
特征提取 隶属度 神经网络 光学字符识别 feature extraction membership degree RBF RBF neural network optical character recognition
重庆大学光电工程学院,人工视觉研究室,重庆,400044
在处理光照不均匀的图像分割时用常用的阈值分割方法不能得到良好的分割效果,通过分析图像特征及对小波分析理论的研究,提出采用小波滤波器将滤波以后的低通图像作为图像的浮动阈值进行二值化,获得了比较理想的效果.该算法在枪支在线OCR识别系统中得到实际应用.
图像处理 小波滤波器 二值化 光学字符识别