基于卷积神经网络的棋子定位和识别方法

韩燮; 赵融; 孙福盛

doi:doi:10.3788/LOP56.081007

激光与光电子学进展, 2019, 56 (8): 081007, 网络出版: 2019-07-26

基于卷积神经网络的棋子定位和识别方法下载： 1330次

Methods for Location and Recognition of Chess Pieces Based on Convolutional Neural Network

论文大纲

韩燮 ^*赵融 ^**孙福盛 ^***

作者单位

中北大学大数据学院, 山西太原 030051

AI 词云图 AI一句话精读 AI短摘要

注：本部分内容由 AI 自动生成，请您知悉。

摘要

中国象棋棋子定位采用的传统图像处理方法,复杂度高;识别棋子采用的传统文字识别方法,泛化性较差、精确度较低。提出一种基于棋子颜色特征的分割方法和改进的二值图像滤波算法,实现了棋子的快速定位,不需要二次修正位置;提出一种基于卷积神经网络的棋子识别方法,该方法可以应用于不同字体的棋子识别,在更换棋子的情况下,依然可以快速、准确地识别棋子。实验结果表明,该方法的定位误差为0.51 mm,平均定位时间0.212 s,对4类字体的平均棋子识别准确率为98.59%左右,证实了该方法的有效性和实用性。

Abstract

The traditional image processing algorithms used for the location of Chinese chess pieces have high complexity and the traditional character recognition methods used for the recognition of chess pieces have low generalization and accuracy. A segmentation method based on chess piece color features and an improved binary image filtering algorithm are proposed to achieve the fast location of chess pieces, and the second correction of positions is not needed. A recognition method of chess pieces based on a convolutional neural network is proposed, which can be used for the recognition of chess pieces with different fonts. In the case of chess piece replacement, this method can still recognize chess pieces quickly and accurately. The experimental results show that as for the proposed method, the location error is 0.51 mm, the average location time is 0.212 s, and the average recognition accuracy of chess pieces with four types of fonts is about 98.59%. The effectiveness and practicability of this method are confirmed.

1 引言

中国象棋是一款经典游戏,其变化多端,趣味无穷,是中华文化的精粹之一。随着机器人技术的快速发展,象棋机器人的智能化程度不断提高。针对象棋机器人的视觉部分,棋子定位和识别尤为重要。

棋子定位决定了机器人是否可以准确地抓取棋子,完成走子。Li等^[1]采用传感器模式,以棋盘作为传感器来定位棋子,这种模式响应快,准确度高,但智能性低、通用性差。类似的还有刘飞等^[2]的射频方法。许丰磊等^[3-5]均依靠棋盘直线检测或交点检测,无法脱离棋盘定位棋子,且定位精度不高。娄联堂等^[6]通过图像减法定位棋子,但该方法对相机和棋盘的稳定性要求高。Wu等^[7]利用形态学滤波和Hough圆检测定位棋子,该方法在光照的强干扰下, Hough检测的时间增加,效率降低。朱一峰^[8]对图像去噪后,根据像素特征统计每一个棋子的像素累加值,再通过调整阈值来分割棋子,该方法在光照不断变化的环境下,需要频繁调整阈值,适应性较差。郭晓峰等^[9]利用像素特征粗定位,再利用Hough圆检测二次定位,该方法在提高准确度的同时,增加了算法运行时间,而且棋子在选材上突出了棋子边缘,不是生活中对弈的棋子,降低了方法的普适性。

棋子识别决定智能博弈算法是否可以准确地计算走棋策略。棋子上的文字具有角度任意性,而且不同的字体,其特征也不同,这样加大了棋子识别的难度。目前,针对象棋文字的识别研究不多。郭晓峰等^[9]利用旋转差分法识别棋子。翟乃强^[10]使用过轮数法统计文字特征。冯元华等^[11]使用文字连通数统计文字特征。党宏社等^[12]利用ORB(ORiented Brief)提取文字特征识别棋子。郭建欣等^[13]利用Hu的7个不变距作为文字特征进行训练,识别棋子。文献[ 9-13]中,由于棋子文字的复杂性,特征提取方法不能较好地处理字体多变的棋子文字,在棋子字体发生变化时,需要人工定义重要的特征点位置或调整文字旋转角度,极大地降低了对不同棋子字体的适用性。王殿君等^[14-15]采用BP(back propagation)神经网络对棋子进行识别,但该网络收敛速度慢,网络结构的选择依靠经验,权值不能共享,具有网络训练失败的可能性。

针对上述问题,从棋子定位和棋子分类识别两方面入手进行优化。首先,在棋子定位上,由于传统的图像处理方法从速度和算法复杂度上优于卷积神经网络的目标检测,且准确度高,故本文根据文字像素特征,将棋子按颜色分别二值化,再应用本文提出的二值图像滤波算法对图像进行去噪,并绘制轮廓、寻找最小外接圆,定位棋子。在棋子的分类识别上,与传统的文字识别方法相比,卷积神经网络的目标分类算法准确度高,在字体样本不同的情况下,不需要人工反复定义文字特征,而且在模型训练完成后,可以对多种常见棋子的文字字体进行识别,泛化能力更好。卷积神经网络应用局部感知野降低参数,收敛速度快,而且权值共享,优于BP神经网络。所以本文选择传统图像处理和卷积神经网络相结合的新方法对棋子定位和识别。

2 整体结构

首先,对采集的棋局图像进行棋子的分割和定位;其次,将定位后的棋子图像作为数据输入,输入至本文的卷积神经网络进行棋子的分类和识别,并将识别结果标注在图像上。整体算法流程图,如图1所示。

图 1. 整体算法流程图

Fig. 1. Flow chart of whole algorithm

下载图片查看所有图片

3 棋子定位

棋子定位算法流程,如图2所示。

图 2. 棋子定位算法流程图

Fig. 2. Flow chart of algorithm for location of chess pieces

下载图片查看所有图片

3.1 图像预处理

由于受空间的限制,相机的光轴不垂直于棋盘,为了降低棋子的定位误差,需要对图像进行预处理。

首先,采用双线性插值法对图像进行密集透视变换,保持承影面上投影几何图形不变。双线性插值是在x,y方向上分别进行一次线性插值。因此,可以准确得到变换后图像上某点P(x,y)的像素值f(P),如(1)式、(2)式所示,先在x方向上进行线性插值:

\begin{matrix} \begin{matrix} f (R_{1}) \approx \frac{x_{2} - x}{x_{2} - x_{1}} f (Q_{11}) + \frac{x - x_{1}}{x_{2} - x_{1}} f (Q_{21}), \\ where R_{1} = (x, y_{1}), (1) \\ f (R_{2}) \approx \frac{x_{2} - x}{x_{2} - x_{1}} f (Q_{12}) + \frac{x - x_{1}}{x_{2} - x_{1}} f (Q_{22}), \\ where R_{2} = (x, y_{2}) 。 (2) \end{matrix} \end{matrix}

再在y方向上进行线性插值,得到点P(x,y)的值,即

\begin{matrix} f (x, y) = f (P) \approx \frac{y_{2} - y}{y_{2} - y_{1}} f (R_{1}) + \frac{y - y_{1}}{y_{2} - y_{1}} f (R_{2}), (3) \end{matrix}

式中:Q₁₁(x₁,y₁),Q₁₂(x₁,y₂),Q₂₁(x₂,y₁),Q₂₂(x₂,y₂)为源图像上的4个点,R₁(x,y₁),R₂(x,y₂)为根据源图像上点的坐标而定义的两个点。

其次,消除背景对棋子分割的干扰,减少处理时间,增加定位精度,对透视变换后的图像设置ROI(Region of Interest),如图3所示。

图 3. 棋盘预处理。(a)透视变换图;(b) ROI图

Fig. 3. Chessboard pretreatment. (a) Perspective transformation picture; (b) ROI picture

下载图片查看所有图片

3.2 棋子定位

3.2.1 棋子分割

象棋棋子具有两个显著特征:形状和文字颜色。若直接用Hough圆检测分割棋子,则计算量大,且检测不准确。所以选择文字颜色特征作为分割依据。

本文采用HSV颜色模型,其中H表示色调、S表示饱和度、V表示明度,经过实验后得到红、绿棋子的H、S、V分量值为:红色H(1-15)、S(60-225)、V(0-93),绿色H(0-95)、S(0-255)、V(0-93)。确定S、V值的范围,可以使棋子在不同光照条件下的分割稳健性更好。

3.2.2 改进二值图像滤波算法

根据某一种颜色特征分割棋子后,在二值图像上会产生另一种颜色的噪声,造成过分割。因此需要对二值图像进行滤波,所提滤波算法如下。

1) 标记图像中的各个连通区域。假如当前像素值为0,就移动到下一个位置扫描。假如当前像素值为1,检查它左边和上边的两个邻接像素(这两个像素一定会在当前像素之前被扫描到)。考虑两个像素值和标记的组合有4种情况:(a)它们的像素值都为0,此时给当前像素一个新的标记(表示一个新的连通域的开始);(b)它们中间只有一个像素值为1,此时当前像素的标记等于像素值为1的标记;(c)它们的像素值都为1且标记相同,此时当前像素的标记等于该标记;(d)它们的像素值为1且标记不同。将其中的较小的值赋给当前像素,之后从另一边回溯到区域的开始像素为止,每次回溯再执行上述4个判断步骤。这样可以保证所有的连通域都被标记出来。

2) 设定阈值T,对所有标记的连通域计算其像素累加值S。令P(x,y)为二值图像上的某个像素值,则

\begin{matrix} P (x, y) = \{\begin{matrix} 255, & S < T \\ 0, & S > T \end{matrix} 。 (4) \end{matrix}

根据(4)式,如果S<T时,则认为此连通域为噪声,将其剔除,反之,则保留。这样,就可将棋子的二值图像滤波到理想的分割效果。

3.2.3 棋子定位

棋盘进行滤波后,需要定位棋子的像素坐标。因此,本文提出了一种棋子定位算法。

1) 图像线性混合。将棋子分割并滤波后的两幅二值图像叠加,如图4所示。

图 4. 线性混合图

Fig. 4. Linear mixture picture

下载图片查看所有图片

2) 棋子膨胀运算。将棋子所在区域与10×10的核进行卷积,求局部最大值,即

\begin{matrix} \begin{matrix} dst (x, y) = \max_{(x', y')} src (x + x', y + y'), \\ s.t. element (x', y') \neq 0, (5) \end{matrix} \end{matrix}

式中:dst为目标图像,src为源图像,element(·)为自定义卷积核,参数包含核的形状、大小和参考点,(x',y')为核覆盖区域的像素点的最大值点,并把这个最大值赋值给参考点(x+x',y+y')指定的像素,最终得到目标图像。

3) 寻找最小外接圆。由于圆具有唯一确定性,因此用最小外接圆包围膨胀运算后的棋子轮廓,从而得到用绿色标识的棋子圆心坐标,即棋子的像素位置,如图5所示。

图 5. 棋子定位图

Fig. 5. Location picture of chess pieces

下载图片查看所有图片

通过上述棋子定位算法,可以简单、高效、准确地快速确定棋子的像素坐标,不需要多次修正棋子坐标。

4 基于卷积神经网络(CNN)的棋子识别

因为棋子上字符的复杂性,其传统特征提取方法不能处理多变的汉字外形,而且需要专业人工定义特征点位置,没有统一标准,所以本文选择基于CNN的棋子识别方法,自动生成其特征,进行网络训练,完成棋子的识别。

在第3节中,已经用红色圆准确定位出棋子。本节将图5中棋盘上的所有棋子提取出来,放入本文训练好的CNN中进行棋子的分类和识别。本节识别算法流程如图6所示。

图 6. 识别算法流程图

Fig. 6. Flow chart of recognition algorithm

下载图片查看所有图片

4.1 卷积神经网络(CNN)

卷积神经网络(CNN)是一种多层的有监督的特征学习网络,具有极强的适应性,善于挖掘数据的局部特征,提取全局训练特征和分类。CNN利用局部感知和神经元之间的权值共享来降低网络模型的复杂度,降低权值的数量,从而加快网络的训练和学习速度,并且使用反向传播算法,使得网络更加收敛,得到更好的训练模型。

CNN的卷积层和池化层是实现卷积神经网络特征提取功能的核心模块。该网络模型通过采用梯度下降法优化损失函数,找到全局最优解。通过频繁的迭代训练可以提高网络精度。CNN的低层由卷积层和最大池化层交替组成,高层是全连接层中对应传统多层感知器的隐含层和逻辑回归分类器。其中,第一个全连接层的输入是由卷积层和子采样层进行特征提取得到的特征图像;最后一层输出层是一个分类器,可以采用逻辑回归、Softmax回归,甚至支持向量机(SVM),对图像进行分类。

4.2 网络结构设计

目前常用的CNN模型有AlexNet^[16]、VGG^[17]、LeNet^[18]、GoogleNet^[19]等。其中AlexNet网络模型网络数较少,精度高;使用Dropout、Data augmentation(数据扩充),避免过拟合;使用局部归一化(LRN),有助于增加泛化能力。因为本文的数据集相对较少,每类的样本相对单一,要尽量避免过拟合,所以,本文选择AlexNet模型,对其改进并用于象棋棋子的分类识别。本文网络结构如图7所示。

网络结构配置信息和数据,如表1、表2所示。表中conv为卷积层,Num_Filter为滤波器数量,LRN为局部响应归一化,FC为全连接,ReLu为激活函数。

图 7. 网络结构

Fig. 7. Network structure

下载图片查看所有图片

表 1. 网络结构配置信息和数据(Conv1~Conv4 layout data)

Table 1. Configuration information and data of network structure (Conv1-Conv4 layout data)

Conv	Conv1	Conv2	Conv3	Conv4
Data_Size	100×100×3	48×48×32	24×24×64	24×24×128
Conv: Num_Filter	32	64	128	128
Conv: padding	0	2	1	1
Conv: Filter_Size	5×5×3	5×5×32	3×3×64	24×24×128
Conv: stride	1	1	1	1
Data_Size after convolution	96×96×32	48×48×64	24×24×128	24×24×128
Activation	ReLU	ReLU	ReLU	ReLU
Data_Size after activation	96×96×32	48×48×64	24×24×128	24×24×128
Pooling: Kernel_Size	2×2	2×2		2×2
Pooling: stride	2	2		2
Data_Size after pooling	48×48×32	24×24×64	24×24×128	12×12×128
LRN(Data_Size)	48×48×32	24×24×64	24×24×128	12×12×128

查看所有表

表 2. 网络结构配置信息和数据(FC1~FC3 layout data)

Table 2. Configuration information and data of network structure(FC1-FC3 layout data)

FC	FC1	FC2	FC3
Data	12×12×128	1024	512
Data after FC	1024	1024	14
Activation	ReLU	ReLU
Data after activation	1024	1024
Dropout Kept_prob	0.5	0.5
Data after dropout fitting	1024	512

查看所有表

最后选择Softmax分类器进行棋子分类识别。它是以多项式分布为模型进行建模。假如网络输出为x₁、x₂、…、x_n,经过Softmax函数进行回归处理,Softmax函数可表示为 $\begin{matrix} softmax {(x)}_{i} = x'_{i} = \frac{\exp (x_{i})}{\overset{n}{\sum_{j = 1}} \exp (x_{j})}, (6) \end{matrix}$ 式中:i,j表示类别索引(i=1,2,…,n);n为分类数(n=14)。将网络的原始输出用作置信度来生成新的输出,其满足概率分布。Softmax分类器的损失函数可表示为 $\begin{matrix} J (x, y, θ) = - \frac{1}{N} [\overset{N}{\sum_{i = 1}} \overset{n}{\sum_{j = 1}} 1 \{y_{i} = j\} \log \frac{\exp ({θ^{T}}_{j} x_{i})}{\overset{n}{\sum_{j = 1}} \exp ({θ^{T}}_{j} x_{i})}], (7) \end{matrix}$ 式中:N为图像数量;θ∈Rⁿ⁺¹为Softmax分类器的模型参数;y_i为每幅图像的标记;j为类别;1 $\begin{matrix} \{y_{i} = j\} \end{matrix}$ 为指示性函数。指示性函数规则为:1{值为真的表达式}=1,1{值为假的表达式}=0。最后通过随机梯度下降法最小化误差函数。

5 实验与结果分析

5.1 棋子数据集

图 8. 棋子数据集示例

Fig. 8. Examples of chess data

下载图片查看所有图片

5.2 实验结果与分析

5.2.1 棋子定位实验利用本文的棋子定位方法,在HSV值不变的情况下[红色H(1-15)、S(60-225)、V(0-93),绿色H(0-95)、S(0-255)、V(0-93)]对棋子定位,实验结果如表3所示,定位平均误差为0.51 mm。将所提棋子定位方法与许丰磊等^[3-14]的实验数据进行对比,结果如表4所示。由实验结果可知,所提棋子定位方法在时间和误差上都优于其他两种方法,可以更准确地抓取棋子。

表 3. 棋子定位实验

Table 3. Location experiment of chess pieces

Piece	Time ofsegmentation /s	Coordinate of image		Calculated coordinate		Actual coordinate		Error /mm
Piece	Time ofsegmentation /s	Col /pixel	Row /pixel		X /mm	Y /mm	X' /mm	Y' /mm
Red_Car	0.173	1292.88	972.66	-56.816	-101.251	-56.7	-100.2	1.09
Red_House	0.177	1286.983	921.603	-57.532	-32.759	-57.5	-61.6	1.15
Red_Ele	0.191	1279.039	869.282	-57.568	-21.625	-57.4	-21.5	0.2
Red_Knight	0.207	1273.411	824.562	-57.65	15.628	-57.5	15.6	0.15
Marshal	0.182	1266.772	777.076	-57.107	56.284	-57.1	56.4	0.12
Red_Gun	0.186	1189.585	919.273	20.505	-62.279	20.5	-61.7	0.58
Red_Pawn	0.18	1128.461	776.132	61.964	55.667	61.7	55.8	0.29
Green_Pawn	0.185	986.305	614.135	185.19	210.372	186.2	210.8	1.1
Green_Gun	0.182	943.496	979.248	219.448	-64.996	219.6	-65	0.15
General	0.179	854.364	771.18	299.646	57.123	299.5	57.5	0.4
Green_Knight	0.184	850.955	814.87	300.597	19.501	300.1	19.2	0.36
Green_Ele	0.183	849.73	863.732	298.672	-21.476	299.1	-21.6	0.45
Green_House	0.183	845.265	918.192	298.95	-65.306	298.8	-65.9	0.61
Green_Car	0.186	843.988	956.32	298.05	-101.029	297.6	-101.3	0.53
Total piece	0.208	-	-	-	-	-	-	0.51

查看所有表

表 4. 实验结果对比

Table 4. Comparison of experimental results

Experimental data	Proposed method	Ref. [3]	Ref. [14]
Location time /s	0.212	0.484	-
Location error /mm	0.51	-	0.87

查看所有表

5.2.2 棋子识别实验

使用本文的CNN网络结构对22400个样本进行训练,迭代次数为20;对5600个样本进行验证,其训练和验证准确率、训练和验证损失值,如图9(a)、(b)所示。

任意抽取4类字体的棋子,任意角度的摆放在棋盘上,进行识别,并将识别结果标注在指定位置。所提方法的识别准确率平均在98.59%左右。4类字体棋子的部分实验结果,如图10所示,矩形框中表示识别结果和识别概率。

选取杜俊利等^[5]中的实验样本为字体一,郭晓峰等^[9]中的实验样本为字体二,字体三、四为4类字体中的其他两种。应用杜俊利等^[5]、郭晓峰等^[9]中给出的实验参数,与本文方法作比较,棋子识别准确率的结果如图11所示,对于不同的字体在文字特征没有被人工反复定义的情况下,本文可以很好地保持棋子识别的准确率,提高了识别的效率。

图 9. 所提方法的训练和验证结果。(a)训练和验证准确率;(b)训练和验证损失值

Fig. 9. Training and verification results of proposed method. (a) Training accuracy and validation accuracy; (b) training loss and verification loss

下载图片查看所有图片

图 10. 基于CNN的棋子识别结果。(a)部分实验结果一;(b)部分实验结果二

Fig. 10. Recognition results of chess pieces based on CNN. (a) Partial experimental results 1; (b) partial experimental results 2

下载图片查看所有图片

图 11. 实验结果对比

Fig. 11. Comparison of experimental results

下载图片查看所有图片

6 结论

采用传统的图像处理和文字识别方法时,中国象棋棋子的定位算法复杂,识别方法泛化能力较差、精确度较低,为此提出一种基于棋子颜色特征的分割方法和改进的二值图像滤波算法,以及一种基于卷积神经网络的棋子识别方法。实验表明,该方法的平均定位误差为0.51 mm,平均定位误差为0.212 s;对4类字体棋子的识别正确率达到98.59%。实验证实了本文方法在棋子识别和定位中的有效性和泛化性。

参考文献

[1] Li S G, Yang X L. Design of intelligent line-tracking chess robot based on STM32[J]. Journal of Measurement Science and Instrumentation, 2014, 5(2): 59-63.

[2] 刘飞, 吕新广. 药品及其包装对超高频RFID标签性能的影响[J]. 重庆邮电大学学报(自然科学版), 2017, 29(4): 563-568.

Liu F, Lü X G. Effects of drug and its packaging on the performance of UHF RFID tag[J]. Journal of Chongqing University of Posts and Telecommunications (Natural Science Edition), 2017, 29(4): 563-568.

[3] 许丰磊. 象棋机器人视觉算法与智能控制软件的研究[D]. 哈尔滨: 哈尔滨工业大学, 2006: 9- 13.

Xu FL. The research of the vision algorithm and intelligent control software for chess robot[D]. Haerbin: Harbin Institute of Technology, 2006: 9- 13.

[4] 肖克先. 象棋机器人嵌入式视觉系统的研究与开发[D]. 北京: 北方工业大学, 2010: 15- 26.

Xiao KX. Research and development of embedded vision system of chess robot[D]. Beijing: North China University of Technology, 2010: 15- 26.

[5] 杜俊俐, 张景飞, 黄心汉. 基于视觉的象棋棋盘识别[J]. 计算机工程与应用, 2007, 43(34): 220-222, 232.

Du J L, Zhang J F, Huang X H. Chess-board recognition based on vision[J]. Computer Engineering and Applications, 2007, 43(34): 220-222, 232.

[6] 娄联堂, 钱磊, 段汕, 等. 基于视频图像理解的中国象棋棋子识别[J]. 中南民族大学学报(自然科学版), 2014, 33(2): 117-122.

Lou L T, Qian L, Duan S, et al. Chessman recognition of Chinese chess based on video image understanding[J]. Journal of South-Central University for Nationalities (Natural Science Edition), 2014, 33(2): 117-122.

[7] WuG, TaoJ. Chinese chess recognition algorithm based on computer vision[C]∥China Control and Decision-Making Conference, 31 May-2 June 2014, Changsha, China. New York: IEEE, 2014: 3375- 3379.

[8] 朱一峰. 象棋机器人视觉识别算法研究[J]. 江汉大学学报(自然科学版), 2013, 41(3): 51-56.

Zhu Y F. Visual recognition algorithm of Chinese chess robot[J]. Journal of Jianghan University (Natural Science Edition), 2013, 41(3): 51-56.

[9] 郭晓峰, 王耀南, 周显恩, 等. 中国象棋机器人棋子定位与识别方法[J]. 智能系统学报, 2018, 13(4): 517-523.

Guo X F, Wang Y N, Zhou X E, et al. Chess-piece localization and recognition method for Chinese chess robot[J]. CAAI Transactions on Intelligent Systems, 2018, 13(4): 517-523.

[10] 翟乃强. 改进的中国象棋棋盘识别方法[J]. 计算机应用, 2010, 30(4): 980-981.

Zhai N Q. Improved Chinese chessboard recognition method[J]. Journal of Computer Applications, 2010, 30(4): 980-981.

[11] 冯元华, 王思华, 柳宁, 等. 机器视觉技术在博弈智能机器人设计中的应用[J]. 计算机工程与设计, 2009, 30(14): 3371-3373,3379.

Feng Y H, Wang S H, Liu N, et al. Application of machine vision technology in design of chess playing intelligent robot[J]. Computer Engineering and Design, 2009, 30(14): 3371-3373, 3379.

[12] 党宏社, 张超, 庞毅, 等. 基于ORB算法的象棋快速识别和定位系统研究[J]. 科学技术与工程, 2017, 17(7): 52-57.

Dang H S, Zhang C, Pang Y, et al. Research of fast recognition and positioning system of chess based on ORB algorithm[J]. Science Technology and Engineering, 2017, 17(7): 52-57.

[13] 郭建欣, 陈文燕. 筛选极坐标投影幅值特征的象棋定位与识别[J]. 科学技术与工程, 2018, 18(21): 268-275.

Guo J X, Chen W Y. Chesslocation and recognition by screening the feature of polar coordinates projection amplitude[J]. Science Technology and Engineering, 2018, 18(21): 268-275.

[14] 王殿君. 基于视觉的中国象棋棋子识别定位技术[J]. 清华大学学报(自然科学版), 2013, 53(8): 1145-1149.

Wang D J. Recognition andpositioning technique of Chinese chess based on vision[J]. Journal of Tsinghua University(Science and Technology), 2013, 53(8): 1145-1149.

[15] 段云涛, 李倩, 申玮. 基于视觉的人机交互下棋系统中棋子定位及识别技术研究[J]. 计算机与数字工程, 2015, 43(8): 1416-1418, 1485.

Duan Y T, Li Q, Shen W. Chess identification & location in the system of human-machine interaction based on vision[J]. Computer and Digital Engineering, 2015, 43(8): 1416-1418, 1485.

[16] Panteley E, Loria A. On global uniform asymptotic stability of nonlinear time-varying systems in cascade[J]. Systems & Control Letters, 1998, 33(2): 131-138.

[17] Cao KC, YangH, JiangB. Formation tracking control of nonholonomic chained form systems[C]∥2013 10th IEEE International Conference on Control and Automation (ICCA), 12-14 June 2013, Hangzhou, China. New York: IEEE, 2013: 846- 851.

[18] ZhouY, Dong XW, LuG, et al. Time-varying formation control for unmanned aerial vehicles with switching interaction topologies[C]∥2014 International Conference on Unmanned Aircraft Systems (ICUAS), 27-30 May 2014, Orlando, FL, USA. New York: IEEE, 2014: 1203- 1209.

[19] Hua M D, Hamel T, Morin P. et al. Introduction to feedback control of underactuated VTOL vehicles[J]. IEEE Control Systems Magazine, 2013, 33(1): 61-75.

韩燮, 赵融, 孙福盛. 基于卷积神经网络的棋子定位和识别方法[J]. 激光与光电子学进展, 2019, 56(8): 081007. Xie Han, Rong Zhao, Fusheng Sun. Methods for Location and Recognition of Chess Pieces Based on Convolutional Neural Network[J]. Laser & Optoelectronics Progress, 2019, 56(8): 081007.

基于卷积神经网络的棋子定位和识别方法 下载： 1330次

1 引言

2 整体结构

图 1. 整体算法流程图

Fig. 1. Flow chart of whole algorithm

3 棋子定位

图 2. 棋子定位算法流程图

Fig. 2. Flow chart of algorithm for location of chess pieces

3.1 图像预处理

图 3. 棋盘预处理。(a)透视变换图;(b) ROI图

Fig. 3. Chessboard pretreatment. (a) Perspective transformation picture; (b) ROI picture

3.2 棋子定位

图 4. 线性混合图

Fig. 4. Linear mixture picture

图 5. 棋子定位图

Fig. 5. Location picture of chess pieces

4 基于卷积神经网络(CNN)的棋子识别

图 6. 识别算法流程图

Fig. 6. Flow chart of recognition algorithm

4.1 卷积神经网络(CNN)

4.2 网络结构设计

图 7. 网络结构

Fig. 7. Network structure

表 1. 网络结构配置信息和数据(Conv1~Conv4 layout data)

Table 1. Configuration information and data of network structure (Conv1-Conv4 layout data)

表 2. 网络结构配置信息和数据(FC1~FC3 layout data)

Table 2. Configuration information and data of network structure(FC1-FC3 layout data)

5 实验与结果分析

5.1 棋子数据集

图 8. 棋子数据集示例

Fig. 8. Examples of chess data

5.2 实验结果与分析

表 3. 棋子定位实验

Table 3. Location experiment of chess pieces

表 4. 实验结果对比

Table 4. Comparison of experimental results

图 9. 所提方法的训练和验证结果。(a)训练和验证准确率;(b)训练和验证损失值

Fig. 9. Training and verification results of proposed method. (a) Training accuracy and validation accuracy; (b) training loss and verification loss

图 10. 基于CNN的棋子识别结果。(a)部分实验结果一;(b)部分实验结果二

Fig. 10. Recognition results of chess pieces based on CNN. (a) Partial experimental results 1; (b) partial experimental results 2

图 11. 实验结果对比

Fig. 11. Comparison of experimental results

6 结论

Article Outline

相关论文

相关资讯

关于本站 Cookie 的使用提示

全站搜索

基于卷积神经网络的棋子定位和识别方法下载： 1330次