激光与光电子学进展, 2019, 56 (24): 241501, 网络出版: 2019-11-26   

基于循环神经网络的图像特定文本抽取方法 下载: 1186次

Extraction Method of Interest Text in Image Based on Recurrent Neural Network
作者单位
华侨大学信息科学与工程学院, 福建 厦门 361021
图 & 表

图 1. 命名实体识别示例

Fig. 1. Example of name entity recognition

下载图片 查看原文

图 2. LSTM网络单元

Fig. 2. LSTM network unit

下载图片 查看原文

图 3. 前向长短时记忆网络结构

Fig. 3. Structure of forward long short time memory network

下载图片 查看原文

图 4. BLSTM网络结构

Fig. 4. Structure of BLSTM network

下载图片 查看原文

图 5. CRF网络结构

Fig. 5. Structure of CRF network

下载图片 查看原文

图 6. BLSTM-CRFs模型结构

Fig. 6. Structure of BLSTM-CRFs model

下载图片 查看原文

图 7. IDTRAIN和IDVAL中生成的文本数据及标签示例。(a)样例a;(b)样例b

Fig. 7. Samples of text data and label generated in IDTRAIN and IDVAL. (a) Sample a; (b) sample b

下载图片 查看原文

图 8. YNIDREAL中的图像样本示例

Fig. 8. Samples of images in YNIDREAL

下载图片 查看原文

图 9. IDVAL上6种实体准确率。 (a) F1值;(b) P值;(c) R

Fig. 9. Accuracy of six entities on IDVAL. (a) F1-score; (b) P value; (c) R value

下载图片 查看原文

图 10. YNIDREAL测试结果示例图。(a)文字检测结果;(b)文字识别结果;(c) BLSTM-CRF模型特定文本抽取结果;(d) CRF模型特定文本抽取结果

Fig. 10. Test results on YNIDREAL dataset. (a) Text detection results; (b) text recognition results; (c) result of interest text extraction using BLSTM-CRF model; (d) result of interest text extraction using CRF model

下载图片 查看原文

表 1实验数据集的分布

Table1. Distribution of experimental data set

ItemDataset categoryDataset typeDataset size
TrainIDTRAINText500
ValidationIDVALText100
TestYNIDREALImage61

查看原文

表 2CRF模型与BLSTM-CRF模型系统性能

Table2. System performances of CRF and BLSTM-CRF models

EntityCRFBLSTM-CRF
P /%R /%F1 /%P /%R /%F1 /%
Name75.0068.8571.7986.8986.8986.89
Gender96.6795.0895.8796.7296.7296.72
Nation95.0093.4494.2193.4493.4493.44
Birth90.1690.1690.1691.8091.8091.80
Address90.4893.4491.9493.6596.7295.16
Idnum92.0695.0893.5590.4893.4491.94
Average89.9089.3489.5992.1693.1792.66

查看原文

表 3特定文本抽取完整性测试结果

Table3. Test results of integrity of interest text extraction

ModelSucceednumberFailnumberSpeed /(image·s-1)Testaccuracy /%
OCRExtraction
CRF44170.179772.13
BLSTM-CRF5470.178288.52

查看原文

杨恒杰, 闫铮, 邬宗玲, 方定邦, 段放. 基于循环神经网络的图像特定文本抽取方法[J]. 激光与光电子学进展, 2019, 56(24): 241501. Hengjie Yang, Zheng Yan, Zongling Wu, Dingbang Fang, Fang Duan. Extraction Method of Interest Text in Image Based on Recurrent Neural Network[J]. Laser & Optoelectronics Progress, 2019, 56(24): 241501.

本文已被 4 篇论文引用
被引统计数据来源于中国光学期刊网
引用该论文: TXT   |   EndNote

相关论文

加载中...

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!