【原文链接】Tri-Perspective View for Vision-Based 3D Semantic Occupancy Prediction-369IT编程

admin管理员组
文章数量:1130349

原文链接：https://openaccess.thecvf/content/CVPR2023/papers/Huang_Tri-Perspective_View_for_Vision-Based_3D_Semantic_Occupancy_Prediction_CVPR_2023_paper.pdf

1. 引言

体素表达需要较大的计算量和特别的技巧（如稀疏卷积），BEV表达难以使用平面特征编码所有3D结构。

本文提出三视图（TPV）表达3D场景。为得到空间中一个点的特征，首先将其投影到三视图平面上，使用双线性插值获取各投影点的特征。然后对3个投影点特征进行求和，得到3D点的综合特征。这样，可以以任意分辨率描述3D场景，并对不同的3D点产生不同的特征。此外，本文还提出基于Transformer的编码器（TPVFormer），以从2D图像获取TPV特征。首先，在TPV网格查询与2D图像特征之间使用图像交叉注意力，将2D信息提升到3D。然后，在TPV特征之间使用跨视图混合注意力进行TPV跨平面交互。

本文进行的任务为3D语义占用估计，其中训练时只有稀疏激光雷达语义标签，但测试时需要所有体素的语义预测，如上图所示。但由于没有基准，只能进行定性分析，或在两个代理任务上进行定量分析：激光雷达分割（稀疏训练、稀疏测试）和3D语义场景补全（密集训练、密集测试）。两任务均仅使用图像数据；对激光雷达分割任务，仅使用激光雷达点云进行点查询以计算评估指标。

3. 提出的方法

3.1 将BEV推广到TPV

本文提出三视图（TPV）表达，不需像BEV表达一样压缩某轴，且可以避免体素表达的立方复杂度，如上图所示。具体来说，学习3个轴对齐的正交平面：
T = [ T H W , T D H , T W D ] , T H W ∈ R H × W × C , T D H ∈ R D × H × C , T W D ∈ R W × D × C T=[T^{HW},T^{DH},T^{WD}],T^{HW}\in\mathbb{R}^{H\times W\times C},T^{DH}\in\mathbb{R}^{D\times H\times C},T^{WD}\in\mathbb{R}^{W\times D\times C} T=[THW,TDH,TWD],THW∈RH×W×C,TDH∈RD×H×C,TWD∈RW×D×C

分别表达俯视图、侧视图和前视图。

点查询的形式：给定世界坐标系下的查询点 ( x , y , z ) (x,y,z) (x,y,z)，TPV表达首先聚合其在三视图平面上的投影，以得到点的综合描述。设投影到TPV平面的坐标为 [ ( h , w ) , ( d , h ) , ( w , d ) ] [(h,w),(d,h),(w,d)] [(h,w),(d,h),(w,d)]，采样的特征为 [ t h w , t d h , t w d ] [t_{hw},t_{dh},t_{wd}] [thw,tdh,twd]，则聚合特征为：
t i j = S ( T , ( i , j ) ) = S ( T , P I J ( x , y , z ) ) , ( i , j ) ∈ { ( h , w ) , ( d , h ) , ( w , d ) } f x y z = A ( t h w , t d h , t w d ) t_{ij}=\mathcal{S}(T,(i,j))=\mathcal{S}(T,\mathcal{P}_{IJ}(x,y,z)),(i,j)\in\{(h,w),(d,h),(w,d)\}\\ f_{xyz}=\mathcal{A}(t_{hw},t_{dh},t_{wd}) tij=S(T,(i,j))=S(T,PIJ(x,y,</

原文链接：https://openaccess.thecvf/content/CVPR2023/papers/Huang_Tri-Perspective_View_for_Vision-Based_3D_Semantic_Occupancy_Prediction_CVPR_2023_paper.pdf

1. 引言

体素表达需要较大的计算量和特别的技巧（如稀疏卷积），BEV表达难以使用平面特征编码所有3D结构。

3. 提出的方法

3.1 将BEV推广到TPV

分别表达俯视图、侧视图和前视图。

本文标签：原文链接 perspective Tri view

版权声明：本文标题：【原文链接】Tri-Perspective View for Vision-Based 3D Semantic Occupancy Prediction 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://it.en369.cn/jiaocheng/1758737122a2783528.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

369IT编程

【原文链接】Tri-Perspective View for Vision-Based 3D Semantic Occupancy Prediction

1. 引言

3. 提出的方法

3.1 将BEV推广到TPV

1. 引言

3. 提出的方法

3.1 将BEV推广到TPV

更多相关文章

Machine Learning: A Probabilistic Perspective on Neur

微信内扫描识别二维码打开网页的时候打开外部默认浏览器打开链接

微信中点击链接直接跳转到手机默认浏览器下载APP的APK文件实现

浏览器网页链接打开本地exe程序

微信里的网址链接域名如何自动跳转到外部浏览器访问源码

客户端百度网盘如何打开别人的链接

linux镜像 百度网盘链接

百度网盘批量转存工具，一次性转存多个分享链接

Kitti数据集百度网盘链接 00-21全

百度网盘不能下载文件，如何用迅雷下载（链接为网盘链接）

win7更改计算机名发生一般性错误,Win7系统Outlook链接打不开出现一般性错误的解法...

IOS 将百度网盘中的文件直接发到微信而不是通过小程序或是网盘链接

win7连电脑安卓安装usb链接驱动

android 点击跳转到qq,网页端如何实现点击链接跳转到QQ（手机QQ）打开会话

网页链接跳转qq聊天界面以及QQ群是什么实现的

网页调启用qq对话聊天客服窗口的链接地址方法大全（包含移动端）

漫步者W800bt，无线蓝牙链接电脑 用浏览器看视频 自动关机

网络 计算机 用户名 密码忘了,电脑上的宽带链接忘记用户名只记得密码怎么办？...

企业微信里打开链接可以访问公司内网

如何在 VM 虚拟机中安装 Win10 操作系统保姆级教程（附链接）_vmware配置好的win10系统下载(4)

发表评论

推荐文章

anaconda警告python未激活_Python位于conda env中，但尚未在Windows virtual en中激活

ChatGPT+Kimi高效生成毕业答辩PPT的终极指南！

Windows10 C盘如何扩容【10min内解决】

【免费下载】 CAD绘图电气元件库

【免费下载】 仿宋-GB2312字体下载

热门文章

win10底部任务栏无响应

Windows下搭建kms激活服务器

25 Creative Ways to Promote Your App for Free

linux清理密码,如何使用Linux-再生龙 清除windows密码

Ceph Cache tier配置

pcr532，nfc读卡器复制家用门禁卡

【免费下载】 仿宋-GB2312字体下载

LLMs之PE：PromptX(将 AI 智能体从通用助手转变为具备行业／角色能力的交互平台)的简介、安装和使用方法、案例应用之详细攻略

计算机配置更新很长时间没反应,电脑安装更新时间过长怎么办

学python需要什么样的电脑,学python要用什么电脑

最新文章

Sublime 32位 激活码

windows下载安装远程桌面工具RealVNC-Server教程(RealVNC_E4_6_1版带注册码)

【亲测免费】 抖音直播伴侣推流密钥获取工具使用教程

【亲测免费】 Proxifer 安装包与注册码

Royal TSX许可证密钥(6.x后所有版本都可以用)

程序员刚毕业，先去大厂镀金还是先去小厂攒经验？

万象2008清空boss账户密码

【Tools】GitBook简明教程

oracle exadata celldisk 闪存盘受损导致性能下降

SDUT 2138 图结构练习——BFSDFS——判断可达性

WordPress get parent category taxonomy

Omit specific product categories from WooCommerce shortcode

Updating Posts table in database without overwriting user generated content

php - Use wp_get_recent_posts with search term

responsive - How to exclude an image size from the Wordpress srcset

linux镜像百度网盘链接

漫步者W800bt，无线蓝牙链接电脑用浏览器看视频自动关机

网络计算机用户名密码忘了,电脑上的宽带链接忘记用户名只记得密码怎么办？...

【免费下载】仿宋-GB2312字体下载

linux清理密码,如何使用Linux-再生龙清除windows密码

【免费下载】仿宋-GB2312字体下载

Sublime 32位激活码

【亲测免费】抖音直播伴侣推流密钥获取工具使用教程