A Comprehensive Study of Knowledge Editing for Large Language Models-369IT编程

admin管理员组
文章数量:1130349

本文是LLM系列文章，针对《A Comprehensive Study of Knowledge Editing for Large Language Models》的翻译。

大型语言模型知识编辑的综合研究

摘要
1 引言
2 背景
- 2.1 大语言模型
- - 2.1.1 LLM中的Transformer
  - 2.1.2 LLM中的知识存储机制
- 2.2 相关技术
3 LLM的知识编辑
- 3.1 前言
- 3.2 任务定义
- 3.3 方法
- - 3.3.1 认知阶段：利用外部知识
  - 3.3.2 关联阶段：将知识合并到模型中
  - 3.3.3 掌握阶段：编辑内部知识
- 3.4 新基准：KnowEdit
- 3.5 知识编辑的评价
4 实验
- 4.1 实验设置
- 4.2 主要结果
- 4.3 知识编辑对一般任务的影响
- 4.4 多任务知识编辑
- 4.5 错误与案例分析
5 分析
- 5.1 不同知识编辑方法的比较
- 5.2 LLM中知识定位的有效性
- 5.3 LLM中的内隐知识结构
6 应用
- 6.1 高效的机器学习
- 6.2 AIGC
- 6.3 可信AI
- 6.4 人机交互：个性化代理
7 讨论与结论

摘要

大型语言模型（LLM）在理解和生成与人类交流密切相关的文本方面显示出非凡的能力。然而，一个主要的限制在于训练过程中由于其广泛的参数化而产生的大量计算需求。世界的动态性进一步加剧了这一挑战，需要经常更新LLM，以纠正过时的信息或整合新知识，从而确保其持续相关性。请注意，许多应用程序要求在训练后不断调整模型，以解决不足或不良行为。人们对用于动态模型修改的高效、轻量级方法越来越感兴趣。为此，近年来，LLM的知识编辑技术蓬勃发展，旨在有效地修改LLM在特定领域内的行为，同时保持各种输入的整体性能。在本文中，我们首先定义了知识编辑问题，然后对前沿方法进行了全面的回顾。从教育和认知研究理论中汲取灵感，我们提出了一个统一的分类标准，将知识编辑方法分为三类：诉诸外部知识、将知识融入模型和编辑内部知识。此外，我们引入了一个新的基准，KnowEdit，用于对具有代表性的知识编辑方法进行全面的实证评估。此外，我们对知识位置进行了深入分析，可以更深入地了解LLM中固有的知识结构。最初被认为是有效引导LLM的一种手段，我们希望从知识编辑研究中获得的见解能够揭示LLM的潜在知识机制。为了促进未来的研究，我们发布了一个开源框架EasyEdit，它将使从业者能够高效灵活地为LLM实施知识编辑。最后，我们讨论了知识编辑的几个潜在应用，概述了其广泛而有影响力的含义。

1 引言

2 背景

本文是LLM系列文章，针对《A Comprehensive Study of Knowledge Editing for Large Language Models》的翻译。

大型语言模型知识编辑的综合研究

摘要
1 引言
2 背景
- 2.1 大语言模型
- - 2.1.1 LLM中的Transformer
  - 2.1.2 LLM中的知识存储机制
- 2.2 相关技术
3 LLM的知识编辑
- 3.1 前言
- 3.2 任务定义
- 3.3 方法
- - 3.3.1 认知阶段：利用外部知识
  - 3.3.2 关联阶段：将知识合并到模型中
  - 3.3.3 掌握阶段：编辑内部知识
- 3.4 新基准：KnowEdit
- 3.5 知识编辑的评价
4 实验
- 4.1 实验设置
- 4.2 主要结果
- 4.3 知识编辑对一般任务的影响
- 4.4 多任务知识编辑
- 4.5 错误与案例分析
5 分析
- 5.1 不同知识编辑方法的比较
- 5.2 LLM中知识定位的有效性
- 5.3 LLM中的内隐知识结构
6 应用
- 6.1 高效的机器学习
- 6.2 AIGC
- 6.3 可信AI
- 6.4 人机交互：个性化代理
7 讨论与结论

摘要

1 引言

2 背景

本文标签： Knowledge Study Comprehensive Editing Models

版权声明：本文标题：A Comprehensive Study of Knowledge Editing for Large Language Models 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://it.en369.cn/jiaocheng/1758750717a2783713.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

369IT编程

A Comprehensive Study of Knowledge Editing for Large Language Models

大型语言模型知识编辑的综合研究

摘要

1 引言

2 背景

大型语言模型知识编辑的综合研究

摘要

1 引言

2 背景

更多相关文章

读《Diffusion Models: A Comprehensive Survey of Methods and Applications》综述

【论文导读】 - A Comprehensive Survey on Trustworthy Graph NeuralNetworks（关于可信图神经网络的全面综述) [隐私保护部分]

YoLo进化史《A COMPREHENSIVE REVIEW OF YOLO: FROM YOLOV1 TOYOLOV8 AND BEYOND》

《A Comprehensive Survey on Community Detection with Deep Learning》简要笔记

Through the comprehensive test of the Miwu

Datasets for Large Language Models: A Comprehensive Survey

Understanding LLMs: A Comprehensive Overview from Training to Inference

ck+database:Comprehensive Database for Facial Expression Analysis论文笔记

A Comprehensive Survey and Experimental Comparison of Graph-Based Approximate NNS 论文简介

ChatGPT 拓展资料：论文阅读A Comprehensive Survey on Pretrained Foundation Models: A History from BERT to Chat

Unlocking the Potential of Use Case Diagrams: A Comprehensive Guide

[综述笔记]Comprehensive review of Transformer-based models in neuroscience, neurology, and psychiatry

【论文阅读】The Deep Learning Compiler: A Comprehensive Survey

A COMPREHENSIVE SURVEY ON EVALUATING LARGE LANGUAGE MODEL APPLICATIONS IN THE MEDICAL INDUSTRY

Comprehensive Privacy Analysis of Deep Learning

图像修复-CVPR2023-Comprehensive and Delicate An Efficient Transformer for Image Restoration

RAG综述：《A Comprehensive Survey of Retrieval-Augmented Generation (RAG)》

行为识别 - A Comprehensive Study of Deep Video Action Recognition

（四十三）：Comprehensive Linguistic-Visual Composition Network for Image Retrieval

论文笔记 VSALM 文献综述《A Comprehensive Survey of Visual SLAM Algorithms》

发表评论

推荐文章

格式化重置电脑

【免费下载】 AutoCAD Map 3D 2024 下载与安装配置指南

在windows下利用docker从私有库上传下载镜像

上手评测i710700k和r93900x哪个好-对比性能有什么区别

在Windows系统中配置32位和64位的GCC编译环境

热门文章

英语在线听力翻译器_英语听力翻译app下载-英语听力翻译官方版v2.1.4-upan

腾讯云TRTC —— 实时音视频介绍以及web本地搭建操作步骤以及解决部分报错

chatgpt-on-wechat多通道接入详解：微信、企业微信、钉钉、飞书等

windows中搭建sonic云真机环境云真机环境搭建-基于docker容器部署

6.Jetson Orin Nano 系统在NVME SSD上备份与恢复

WIN10X64LTSB2016极限精简版by双心：打造轻便高效的操作系统体验

纯命令行+美观UI，10款实用开源下载工具

darknet53.conv.74免费下载

究竟什么才是评判笔记本电脑好坏的唯一标准

Java应用实现中英文互转功能

最新文章

Sublime 32位 激活码

windows下载安装远程桌面工具RealVNC-Server教程(RealVNC_E4_6_1版带注册码)

【亲测免费】 抖音直播伴侣推流密钥获取工具使用教程

【亲测免费】 Proxifer 安装包与注册码

Royal TSX许可证密钥(6.x后所有版本都可以用)

程序员刚毕业，先去大厂镀金还是先去小厂攒经验？

万象2008清空boss账户密码

【Tools】GitBook简明教程

oracle exadata celldisk 闪存盘受损导致性能下降

SDUT 2138 图结构练习——BFSDFS——判断可达性

WordPress get parent category taxonomy

Omit specific product categories from WooCommerce shortcode

Updating Posts table in database without overwriting user generated content

php - Use wp_get_recent_posts with search term

responsive - How to exclude an image size from the Wordpress srcset

Sublime 32位激活码

【亲测免费】抖音直播伴侣推流密钥获取工具使用教程