论文阅读： Mobile Edge Intelligence for Large LanguageModels: A Contemporary Survey-369IT编程

admin管理员组
文章数量:1130349

地址：Mobile Edge Intelligence for Large Language Models: A Contemporary Survey

摘要

设备端大型语言模型（LLMs）指在边缘设备上运行 LLMs，与云端模式相比，其成本效益更高、延迟更低且更能保护隐私，因此引发了广泛关注。然而，设备端 LLMs 的性能本质上受限于边缘设备的资源约束。移动边缘智能（MEI）介于云端 AI 和设备端 AI 之间，通过在移动网络边缘提供 AI 能力，允许终端用户将繁重的 AI 计算卸载到附近的边缘服务器，为这一问题提供了可行解决方案。本文对利用 MEI 支持 LLMs 的研究进行了最新综述：首先，通过若干典型应用场景说明在网络边缘部署 LLMs 的迫切需求；其次，介绍 LLMs 和 MEI 的基础知识，以及资源高效的 LLM 技术；随后，概述面向 LLMs 的 MEI 架构（MEI4LLM），阐述其核心组件及对 LLMs 部署的支持方式；接着，深入探讨 MEI4LLM 的各个方面，包括边缘 LLM 缓存与分发、边缘 LLM 训练和边缘 LLM 推理；最后，指出未来的研究方向。希望本文能启发研究者利用移动边缘计算推动 LLMs 部署，从而在各类隐私敏感和延迟敏感型应用中释放 LLMs 的潜力。

概述

背景与动机
- 云端 LLMs 存在隐私泄露、带宽成本高、延迟长等问题；设备端 LLMs 受限于资源，难以支持大规模模型和复杂任务。
- MEI 作为折中方案，通过边缘服务器提供 AI 能力，平衡计算资源、延迟和隐私需求，成为 6G 时代 LLMs 部署的关键方向。
核心应用场景
聚焦四个对边缘部署 LLMs 需求迫切的场景：
- 移动医疗：需低延迟处理敏感健康数据，符合隐私法规（如 GDPR）；
- 类人机器人：依赖实时响应（10-100ms 延迟）和本地化数据处理；
- 虚拟助手：要求低延迟交互（<200ms）和用户数据隐私保护；
- 自动驾驶：需超低延迟（10ms 级）和处理海量多模态传感器数据。
基础技术
- LLMs 基础：基于 Transformer 架构，分为编码器仅用、解码器仅用、编码器 - 解码器三类，支持文本、图像等多模态输入，存在自回归生成等特性。
- MEI 基础：融合移动边缘计算与 AI，通过边缘服务器实现分布式训练和推理，支持联邦学习、拆分学习等框架。
- 资源高效技术：包括模型压缩（量化、剪枝、知识蒸馏）、快速解码（投机解码、早期退出）、参数高效微调（LoRA、前缀调优）等。
MEI4LLM 架构
- 核心组件：AI 原生网络架构、参数共享的 LLM

地址：Mobile Edge Intelligence for Large Language Models: A Contemporary Survey

摘要

概述

背景与动机
- 云端 LLMs 存在隐私泄露、带宽成本高、延迟长等问题；设备端 LLMs 受限于资源，难以支持大规模模型和复杂任务。
- MEI 作为折中方案，通过边缘服务器提供 AI 能力，平衡计算资源、延迟和隐私需求，成为 6G 时代 LLMs 部署的关键方向。
核心应用场景
聚焦四个对边缘部署 LLMs 需求迫切的场景：
- 移动医疗：需低延迟处理敏感健康数据，符合隐私法规（如 GDPR）；
- 类人机器人：依赖实时响应（10-100ms 延迟）和本地化数据处理；
- 虚拟助手：要求低延迟交互（<200ms）和用户数据隐私保护；
- 自动驾驶：需超低延迟（10ms 级）和处理海量多模态传感器数据。
基础技术
- LLMs 基础：基于 Transformer 架构，分为编码器仅用、解码器仅用、编码器 - 解码器三类，支持文本、图像等多模态输入，存在自回归生成等特性。
- MEI 基础：融合移动边缘计算与 AI，通过边缘服务器实现分布式训练和推理，支持联邦学习、拆分学习等框架。
- 资源高效技术：包括模型压缩（量化、剪枝、知识蒸馏）、快速解码（投机解码、早期退出）、参数高效微调（LoRA、前缀调优）等。
MEI4LLM 架构
- 核心组件：AI 原生网络架构、参数共享的 LLM

本文标签：论文 edge Mobile intelligence Survey

版权声明：本文标题：论文阅读： Mobile Edge Intelligence for Large LanguageModels: A Contemporary Survey 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://it.en369.cn/jiaocheng/1763900038a2970567.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

369IT编程

论文阅读： Mobile Edge Intelligence for Large LanguageModels: A Contemporary Survey

摘要

概述

摘要

概述

更多相关文章

论文阅读 [CVPR-2022] An Efficient Training Approach for Very Large Scale Face Recognition

【论文阅读】A Transformer-based Approach for Source Code Summarization

论文阅读RoBERTa: A Robustly Optimized BERT Pretraining Approach

论文笔记：Weighted Graph Cuts without Eigenvectors:A Multilevel Approach

【论文笔记】A Unified Approach for Tracking UAVs in Infrared

【论文笔记】PassGAN: A Deep Learning Approach for Password Guessing

PDF公式转化到Word（PDF论文中公式转化）

2025年AI论文工具精选榜单，助你高效完成学术写作任务。

计算机组装与维护 参考文献,浅谈计算机的日常维护论文

jquery mobile + 百度地图 + phonegap 写的一个&quot;校园助手&quot;的app

Android毕业设计下载（全套源码+配套论文）——基于Android+Eclipse的手机安全卫士设计与实现

【论文解读】GPT Understands, Too

【知识】让AI帮你读懂论文的Prompt

论文学习 | SCAFFOLD 相比基于 GPT-4V 的链式推理（CoT）提示方法具有明显优势

windows mobile ?

pdf在线翻译_如何在线翻译整篇PDF论文？

英文论文专业词翻译技巧

论文翻译器：pdf 英文论文一键转换成中英文对照的文档

免费翻译pdf格式论文

《最强码农的水论文攻略》之水论文大法第三期--以IEEE access为例

发表评论

推荐文章

白嫖党福利！免费白嫖三个月云电脑

Does the Expansion of Urban Construction Land Promote Regional Economic Growth in China?

近期新机怎么选？安卓旗舰成市场新赢家，加持ToDesk远控实现设备自由

pp助手苹果版本_腾讯桌球安卓和苹果系统如何进28以及怎么解决没有金币时的烦恼...

阿里云镜像源无法访问？使用 DaoCloud 镜像源加速 Docker 下载（Linux 和 Windows 配置指南）

热门文章

百度云盘和谐下载和云播

计算机c盘满了怎么移到d盘去,Win10电脑c盘满了怎么转移到d盘？

学校有个人邮箱可以用吗？个人申请电子邮箱注册

通过Adb无需ROOT卸载手机内置APP

什么是刷机精灵 刷机精灵有什么用？

如何利用ChatGPT联系英语口语和听写！分享一些Prompt！

如何看待浏览器越来越臃肿，手机浏览器现状堪忧

GNSS数据处理（一）——开源GNSS数据处理软件介绍

计算机专业名称bios翻译,BIOS中各英文的意思是什么？BIOS英文全翻译

打工人必备的会议实时翻译工具，3秒解决会议语言不通尴尬

最新文章

Sublime 32位 激活码

windows下载安装远程桌面工具RealVNC-Server教程(RealVNC_E4_6_1版带注册码)

【亲测免费】 抖音直播伴侣推流密钥获取工具使用教程

【亲测免费】 Proxifer 安装包与注册码

Royal TSX许可证密钥(6.x后所有版本都可以用)

程序员刚毕业，先去大厂镀金还是先去小厂攒经验？

万象2008清空boss账户密码

【Tools】GitBook简明教程

oracle exadata celldisk 闪存盘受损导致性能下降

SDUT 2138 图结构练习——BFSDFS——判断可达性

WordPress get parent category taxonomy

Omit specific product categories from WooCommerce shortcode

Updating Posts table in database without overwriting user generated content

php - Use wp_get_recent_posts with search term

responsive - How to exclude an image size from the Wordpress srcset

计算机组装与维护参考文献,浅谈计算机的日常维护论文

jquery mobile + 百度地图 + phonegap 写的一个"校园助手"的app

什么是刷机精灵刷机精灵有什么用？

Sublime 32位激活码

【亲测免费】抖音直播伴侣推流密钥获取工具使用教程