2023年7月26日发(作者:)
计算机与多媒体技术Computer
And
Multimedia
Technology电子技术与软件工程Electronic
Technology
&
Software
Engineering基于卷积神经网络的图像识别文/秦川(四川省体育彩票管理中心
四川省成都市
610017
)摘
要:本文针对猫狗图像二分类问题,以深度学习框架Keras为基础,提出一种333卷积神经网络架构,以softmax函数作为输出
层激活函数,对每一层均使用Dropout方法来缓解过拟合现象。通过对模型的训练,其实验结果表明,该模型能够达到90%的精度。关键词:CNN;图像识别;猫狗1引言图像识别技术起源于20世纪40年代,其识别步骤主要包括:
图像采集一图像预处理一特征提取一图像识别。由于技术与硬件等
落后的问题,没有促使传统的图像识别技术的发展。但20世纪90
年代后,深度学习技术的出现使得图像识别技术有了新的发展方向。深度学习(DL)是机器学习(ML)领域中一个新的研究方向,
它被引入的目的是为了达到机器学习最初的目标一一人工智能。深度学习主要是通过构建
一个多层网络,使该网络自动学习并获取数据内部的隐藏信息,提
取出更高维、更抽象的数据,该数据相对于图像识别领域来说就是
图像的特征。基于卷积运算的神经网络系统,即卷积神经网络(CNN)
就是深度学习中主要的研究方法之一。本文主要讲解卷积神经网络
的架构,并以猫狗图像识别为例,将其实现。2国内外现状在文献[1]中,邱靖等人为传统水稻病害的图像识别技术对图
像特定特征依赖性强、识别效率低等问题,提出通过卷积神经网络
建立水稻病害识别模型,基于深度学习框架Keras进行训练。模型
经过5次迭代之后,其识别准确率就能够达到90%以上,并且泛
化能力较强。在文献[2]中,凌语等人为帮助病理医生诊断乳腺肿瘤,提出
了一种在VGG-19神经网络模型上改进的VGG-19A神经网络模型,
其主要在卷积层中的激活函数前加入批标准化(BN)算法,在全
连接层中加入dropconnect网络层来改进网络模型。对照实验表明,
改进的算法在准确性与泛化性能上有一定的提升。图2:卷积层示意图的ME-NBI图像分类方案。其实验结果表明,该方案的准确率可以
达到85.3%。在文献[8]中,Qiao
weilei等人提出一种针对合成孔径雷达
(SAR)图像特点的改进卷积神经网络模型一一Q-neto
Q-net实现
在文献[3]中,邱津怡等人针对葡萄图像中同一类别的差异较
大,不同类别的差异较小的问题,提出了一种基于CNN的多尺度
葡萄图像识别方案。通过对数据的扩增、融合人后、采用迁移学习
7SAR图像中的自动目标识别,该模型在对三种目标进行分类时,
其识别精度高达97.58%o和CNN方法来进行分类识别,在最后提出了适合其数据集的多尺
度图像数据融合模型MS-EAlexNeto虽然该模型的测试准确率高达
在文献[9]中,刘万军等人提出一种基于双重优化的卷积神经
网络算法,以提高卷积神经网络算法的识别精度和收敛速度。该算
法实现了卷积和全连接过程的集成优化,与局部优化网络相比,
99.92%,但其泛化性能不强。在文献[4]中,廖恩红等人提出一种
新的食品图像识别模型China
Food-CNN,来解决卷积神经网络识
别相似图像难度大等问题,以实现对食物的精准分类。其实验结果
表明该模型对食品图像的识别准确率为69.2%O在文献[5]中,刘嘉政提出一种基于CNN的小样本树皮图像
识别方案,以解决树皮图像分类过程中图像训练样本少,识别率低
等问题。其实验结果表明该方案在MNIST数据集.ImageNet数据集、
CIFAR-10数据集上的准确率为92%、90%、93%。集成优化网络具有更高的收敛速度和识别精度。在文献[10]中,
Andrea
Acevedo等人提出一种利用卷积神经网络的迁移学习方法对
八组外周血细胞进行高精度自动分类系统。该方案无需进行图像分
割,自动进行特征提取,并且可以对现有模型进行微调,以获得特
定的分类器。其实验表明,使用Vgg-16提取特征时,其准确率为
86%
o3卷积神经网络结构设计3.
1数据预处理在文献[6]中,Tasleem
Kausar等人提出一种基于卷积神经网
络和小波分解图像的乳房组织病理学图像分类的方案。其主要通过
使用2级Haar小波将原始的2048*1536*3图像分解为512*384*3,
再通过CNN模型进行训练。该方案大大减少了深层CNN的卷积
我们拿到的是三通道型、图像长宽不一致的数据。因此我们将
数据进行处理,先缩放为126x126大小的图像,再将图像灰度化。
时间,节约了计算资源。在ICIAR
2018验证数据上的准确率为
并且将图像矩阵进行归一化,使得图像的灰度值在0〜1之间。98.2%o在文献
⑺中,Horiuchi
Yusuke等人为解决放大内窥镜(ME-
3.2网络结构本文所使用的卷积神经网络模型如图1所示,该网络结构主要
包含3个卷积层,3个池化层,3个全连接层,1个输出层。NBI)与窄带成像区分胃癌和胃炎的问题,提出了基于CNN系统98
发布者:admin,转转请注明出处:http://www.yc00.com/web/1690332575a333977.html
评论列表(0条)