新型深度神经网络架构：ENet模型-369IT编程

admin管理员组
文章数量:1037775

新型深度神经网络架构：ENet模型

语义分割技术能够为图像中的每个像素分配一个类别标签，这对于理解图像内容和在复杂场景中找到目标对象至关重要。在自动驾驶和增强现实等应用中，实时性是一个硬性要求，因此设计能够快速运行的卷积神经网络非常关键。

尽管深度卷积神经网络（如VGG16等）在分类和识别任务上取得了巨大成功，但它们在像素级图像标注上提供的空间结果较为粗糙。通常需要将CNN与其他算法（例如基于颜色的分割或条件随机场）级联以细化结果。许多移动或电池供电的应用需要以高于每秒10帧（fps）的速率处理图像，这对算法的运行效率提出了更高的要求。然而，现有的基于深度学习的方法往往因为参数众多和推理时间长而难以满足这一需求。

为了解决这些问题，论文提出了ENet，这是一个专为低延迟操作而设计的新型深度神经网络架构。ENet在保持相似或更高准确度的同时，显著减少了计算量、参数数量，并提高了运行速度。ENet的主要目标是在资源受限的移动设备上实现高效的语义分割，同时在高端GPU上也展现出高效的性能，以满足数据中心等场景下对大规模高分辨率图像处理的需求。

不同数据集上的ENet预测(从左到右为cityscape、CamVid和SUN)：

image.png

ENet（Efficient Neural Network）

模型架构：

ENet网络框架是一种专为实时语义分割任务设计的深度学习模型，它采用了高效的编码器-解码器结构，包含多个阶段，每个阶段由多个瓶颈模块（bottleneck blocks）组成。

1. 初始阶段： 这个阶段使用一个单独的卷积块，包括一个3x3的卷积层，步长为2，用于快速将输入图像下采样，减少分辨率，同时增加特征图的数量。

image.png

2. 编码器：

瓶颈模块（Bottleneck Modules）：ENet的编码器由多个瓶颈模块组成，每个模块包含以下子层：

1x1投影卷积：用于降维，减少特征图的数量。
主卷积层：可以是3x3的常规卷积、扩张卷积或5x5的不对称卷积（由5x1和1x5的卷积组成）。
1x1扩展卷积：用于升维，恢复特征图的数量。
批量归一化（Batch Normalization） 和 PReLU激活函数：在所有卷积层之后使用，以加速训练并提高模型稳定性。
下采样：通过最大池化层或步长为2的卷积层实现，减少特征图的空间尺寸。

3. 重复部分： 编码器中包含重复的部分，其中不包含下采样的瓶颈模块，以进一步提取特征。

4. 解码器： 解码器同样由瓶颈模块组成，但执行的是上采样操作，逐步恢复特征图的空间尺寸。

上采样模块：与编码器中的下采样相对应，使用上采样卷积层逐步增加特征图的分辨率。
最大池化与最大反池化（Max Unpooling）：编码器中使用最大池化减少尺寸，在解码器中使用最大反池化恢复尺寸。

5. 全卷积层：

在解码器的最后，使用一个全卷积层将特征图转换成最终的语义分割图，该层的输出通道数等于类别数。

模型特点：

速度快：比现有模型快18倍。
计算量低：需要的浮点运算次数（FLOPs）少75倍。
参数少：参数数量少79倍。
精度高：提供与现有模型相似或更好的精度。

实验步骤

数据集：在CamVid、Cityscapes和SUN数据集上进行测试。

评估指标：使用类平均精度（class average accuracy）和交并比（intersection-over-union, IoU）作为性能评估指标。

训练过程：首先训练编码器，然后添加解码器并训练整个网络进行上采样和像素级分类。

优化算法：使用Adam优化算法，设置学习率为5e-4，L2权重衰减为2e-4，批量大小为10。

实验结果

1.性能对比：ENet在NVIDIA Jetson TX1嵌入式系统模块和NVIDIA Titan X GPU上的性能均优于现有的SegNet模型。ENet在NVIDIA TX1上的推理速度能够达到21.1fps（640x360分辨率），显示出其在实时应用中的潜力：

image.png

2.精度：在Cityscapes数据集上，ENet在类IoU、类iIoU和类别IoU上均优于SegNet。在Cityscapes数据集上，ENet在类IoU上达到了58.3%，在iIoU上达到了34.4%，优于SegNet模型。

image.png

结论

ENet模型通过其创新的设计，在保持高精度的同时显著提高了语义分割的速度，使其适用于实时应用，尤其是在计算资源受限的移动设备上。尽管主要目标是在移动设备上运行网络，但在高端gpu(如NVIDIA Titan x)上也非常高效。这可能在需要处理大量高分辨率图像的数据中心应用程序中很有用。ENet允许以更快、更有效的方式执行大规模计算，这可能会大大节省成本。

新型深度神经网络架构：ENet模型

不同数据集上的ENet预测(从左到右为cityscape、CamVid和SUN)：

image.png

ENet（Efficient Neural Network）

模型架构：

image.png

2. 编码器：

瓶颈模块（Bottleneck Modules）：ENet的编码器由多个瓶颈模块组成，每个模块包含以下子层：

1x1投影卷积：用于降维，减少特征图的数量。
主卷积层：可以是3x3的常规卷积、扩张卷积或5x5的不对称卷积（由5x1和1x5的卷积组成）。
1x1扩展卷积：用于升维，恢复特征图的数量。
批量归一化（Batch Normalization） 和 PReLU激活函数：在所有卷积层之后使用，以加速训练并提高模型稳定性。
下采样：通过最大池化层或步长为2的卷积层实现，减少特征图的空间尺寸。

3. 重复部分： 编码器中包含重复的部分，其中不包含下采样的瓶颈模块，以进一步提取特征。

4. 解码器： 解码器同样由瓶颈模块组成，但执行的是上采样操作，逐步恢复特征图的空间尺寸。

上采样模块：与编码器中的下采样相对应，使用上采样卷积层逐步增加特征图的分辨率。
最大池化与最大反池化（Max Unpooling）：编码器中使用最大池化减少尺寸，在解码器中使用最大反池化恢复尺寸。

5. 全卷积层：

在解码器的最后，使用一个全卷积层将特征图转换成最终的语义分割图，该层的输出通道数等于类别数。

模型特点：

速度快：比现有模型快18倍。
计算量低：需要的浮点运算次数（FLOPs）少75倍。
参数少：参数数量少79倍。
精度高：提供与现有模型相似或更好的精度。

实验步骤

数据集：在CamVid、Cityscapes和SUN数据集上进行测试。

评估指标：使用类平均精度（class average accuracy）和交并比（intersection-over-union, IoU）作为性能评估指标。

训练过程：首先训练编码器，然后添加解码器并训练整个网络进行上采样和像素级分类。

优化算法：使用Adam优化算法，设置学习率为5e-4，L2权重衰减为2e-4，批量大小为10。

实验结果

image.png

结论

本文标签：新型深度神经网络架构ENet模型

版权声明：本文标题：新型深度神经网络架构：ENet模型内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://it.en369.cn/jiaocheng/1748271615a2277991.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

369IT编程

新型深度神经网络架构：ENet模型

新型深度神经网络架构：ENet模型

ENet（Efficient Neural Network）

模型架构：

模型特点：

实验步骤

实验结果

结论

新型深度神经网络架构：ENet模型

ENet（Efficient Neural Network）

模型架构：

模型特点：

实验步骤

实验结果

结论

更多相关文章

新型深度神经网络架构：ENet模型

发表评论

推荐文章

Java Stream 深入浅出

【愚公系列】《高效使用DeepSeek》030

LLM在智能应用中的新突破：最新技术趋势解析

重学Java基础篇—类的生命周期深度解析

【服务器】本地服务器wampmanager服务器离线

热门文章

【赵渝强老师】Oracle的闪回删除

MySQL中的内连接与外连接详解：基础与进阶应用

DDD应用服务、领域服务傻傻分不清楚？看这篇就够了

鸿蒙特效教程04

【YashanDB知识库】yasqlas sysdba无法登录

【远程工具系列】节点小宝、RustDesk、向日葵、ToDesk、TeamViewer、AnyDesk ——六款主流远程控制软件横向测评对比

安装教程：windows上安装oracle详细教程

使用临时环境转变微服务测试5种方式

69.9K star！这个API调试神器让你告别Postman，开源免费真香！

与Linux的第一次约会：如何避免“尬聊”并爱上终端？

最新文章

LLM学习笔记：如何理解LLM中的Transformer架构

o3 deep research: 智能体的应用和演进

从开发者视角洞见未来，找到自己的破局之道：Deepseek和Manus如何助力破局？

嵌入式Linux：阻塞式IO与非阻塞式IO

STM32如何精准控制步进电机？

程序员刚毕业，先去大厂镀金还是先去小厂攒经验？

万象2008清空boss账户密码

【Tools】GitBook简明教程

oracle exadata celldisk 闪存盘受损导致性能下降

SDUT 2138 图结构练习——BFSDFS——判断可达性

How to vary WooCommerce product prices based on order dates

For a menu custom link (without a link) a &quot;#&quot; is appended. Can this just be blank, i.e. NO link?

multisite - Hook into &#39;admin_url&#39; but only on Mysites admin bar menu

Global login to password protected pages

having a page in multi sub-menu and match current-menu-item

For a menu custom link (without a link) a "#" is appended. Can this just be blank, i.e. NO link?

multisite - Hook into 'admin_url' but only on Mysites admin bar menu