基于卷积神经网络的图像识别

基于卷积神经网络的图像识别

2023年7月26日发(作者:)

计算机与多媒体技术Computer

And

Multimedia

Technology电子技术与软件工程Electronic

Technology

&

Software

Engineering基于卷积神经网络的图像识别文/秦川(四川省体育彩票管理中心

四川省成都市

610017

)摘

要:本文针对猫狗图像二分类问题,以深度学习框架Keras为基础,提出一种333卷积神经网络架构,以softmax函数作为输出

层激活函数,对每一层均使用Dropout方法来缓解过拟合现象。通过对模型的训练,其实验结果表明,该模型能够达到90%的精度。关键词:CNN;图像识别;猫狗1引言图像识别技术起源于20世纪40年代,其识别步骤主要包括:

图像采集一图像预处理一特征提取一图像识别。由于技术与硬件等

落后的问题,没有促使传统的图像识别技术的发展。但20世纪90

年代后,深度学习技术的出现使得图像识别技术有了新的发展方向。深度学习(DL)是机器学习(ML)领域中一个新的研究方向,

它被引入的目的是为了达到机器学习最初的目标一一人工智能。深度学习主要是通过构建

一个多层网络,使该网络自动学习并获取数据内部的隐藏信息,提

取出更高维、更抽象的数据,该数据相对于图像识别领域来说就是

图像的特征。基于卷积运算的神经网络系统,即卷积神经网络(CNN)

就是深度学习中主要的研究方法之一。本文主要讲解卷积神经网络

的架构,并以猫狗图像识别为例,将其实现。2国内外现状在文献[1]中,邱靖等人为传统水稻病害的图像识别技术对图

像特定特征依赖性强、识别效率低等问题,提出通过卷积神经网络

建立水稻病害识别模型,基于深度学习框架Keras进行训练。模型

经过5次迭代之后,其识别准确率就能够达到90%以上,并且泛

化能力较强。在文献[2]中,凌语等人为帮助病理医生诊断乳腺肿瘤,提出

了一种在VGG-19神经网络模型上改进的VGG-19A神经网络模型,

其主要在卷积层中的激活函数前加入批标准化(BN)算法,在全

连接层中加入dropconnect网络层来改进网络模型。对照实验表明,

改进的算法在准确性与泛化性能上有一定的提升。图2:卷积层示意图的ME-NBI图像分类方案。其实验结果表明,该方案的准确率可以

达到85.3%。在文献[8]中,Qiao

weilei等人提出一种针对合成孔径雷达

(SAR)图像特点的改进卷积神经网络模型一一Q-neto

Q-net实现

在文献[3]中,邱津怡等人针对葡萄图像中同一类别的差异较

大,不同类别的差异较小的问题,提出了一种基于CNN的多尺度

葡萄图像识别方案。通过对数据的扩增、融合人后、采用迁移学习

7SAR图像中的自动目标识别,该模型在对三种目标进行分类时,

其识别精度高达97.58%o和CNN方法来进行分类识别,在最后提出了适合其数据集的多尺

度图像数据融合模型MS-EAlexNeto虽然该模型的测试准确率高达

在文献[9]中,刘万军等人提出一种基于双重优化的卷积神经

网络算法,以提高卷积神经网络算法的识别精度和收敛速度。该算

法实现了卷积和全连接过程的集成优化,与局部优化网络相比,

99.92%,但其泛化性能不强。在文献[4]中,廖恩红等人提出一种

新的食品图像识别模型China

Food-CNN,来解决卷积神经网络识

别相似图像难度大等问题,以实现对食物的精准分类。其实验结果

表明该模型对食品图像的识别准确率为69.2%O在文献[5]中,刘嘉政提出一种基于CNN的小样本树皮图像

识别方案,以解决树皮图像分类过程中图像训练样本少,识别率低

等问题。其实验结果表明该方案在MNIST数据集.ImageNet数据集、

CIFAR-10数据集上的准确率为92%、90%、93%。集成优化网络具有更高的收敛速度和识别精度。在文献[10]中,

Andrea

Acevedo等人提出一种利用卷积神经网络的迁移学习方法对

八组外周血细胞进行高精度自动分类系统。该方案无需进行图像分

割,自动进行特征提取,并且可以对现有模型进行微调,以获得特

定的分类器。其实验表明,使用Vgg-16提取特征时,其准确率为

86%

o3卷积神经网络结构设计3.

1数据预处理在文献[6]中,Tasleem

Kausar等人提出一种基于卷积神经网

络和小波分解图像的乳房组织病理学图像分类的方案。其主要通过

使用2级Haar小波将原始的2048*1536*3图像分解为512*384*3,

再通过CNN模型进行训练。该方案大大减少了深层CNN的卷积

我们拿到的是三通道型、图像长宽不一致的数据。因此我们将

数据进行处理,先缩放为126x126大小的图像,再将图像灰度化。

时间,节约了计算资源。在ICIAR

2018验证数据上的准确率为

并且将图像矩阵进行归一化,使得图像的灰度值在0〜1之间。98.2%o在文献

⑺中,Horiuchi

Yusuke等人为解决放大内窥镜(ME-

3.2网络结构本文所使用的卷积神经网络模型如图1所示,该网络结构主要

包含3个卷积层,3个池化层,3个全连接层,1个输出层。NBI)与窄带成像区分胃癌和胃炎的问题,提出了基于CNN系统98

发布者:admin,转转请注明出处:http://www.yc00.com/web/1690332575a333977.html

相关推荐

发表回复

评论列表(0条)

  • 暂无评论

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信