A Diversity-Promoting Objective Function for Neural Conversation Models论文阅读笔记-369IT编程

admin管理员组
文章数量:1130349

本文是李纪为的论文“A Diversity-Promoting Objective Function for Neural Conversation Models”阅读笔记。违章提出使用MMI代替原始的maximum likelihood作为目标函数，目的是使用互信息减小“I don’t Know”这类无聊响应的生成概率。一般的seq2seq模型，倾向于生成安全、普适的响应，因为这种响应更符合语法规则，在训练集中出现频率也较高，最终生成的概率也最大，而有意义的响应生成概率往往比他们小。通过MMI来计算输入输出之间的依赖性和相关性，可以减少模型对他们的生成概率。本文提出了两种模型（其实就是改了下目标函数，而且训练过程中仍然使用likelihood，仅在测试的时候使用新的目标函数将有意义的响应的概率变大~~），MMI-antiLM和MMI-bidi，下面分别进行介绍。

新的目标函数

在介绍模型之前先来看看新的目标函数和普通的目标函数的区别，以便清楚地明白新目标函数的作用和功能。首先看下原始的目标函数，就是在给定输入S的情况下生成T的概率，其实就是一个T中每个单词出现的条件概率的连乘。

接下来看提出的第一个目标函数MMI-antiLM，在其基础上添加了目标序列本身的概率logp(T)，p(T)就是一句话存在的概率，也就是一个模型，前面的lambda是惩罚因子，越大说明对语言模型惩罚力度越大。由于这里用的是减号，所以相当于在原本的目标上减去语言模型的概率，也就降低了“I don’t know”这类高频句子的出现概率。

然后是第二个目标函数MMI-bidi，在原始目标函数基础上添加logp(S|T)，也就是T的基础上产生S的概率，而且可以通过改变lambda的大小衡量二者的重要性。后者可以表示在响应输入模型时产生输入的概率，自然像“I don’t know”这种答案的概率会比较低，而这里使用的是相加，所以会降低这

新的目标函数

本文标签：笔记论文 objective Promoting Diversity

版权声明：本文标题：A Diversity-Promoting Objective Function for Neural Conversation Models论文阅读笔记内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://it.en369.cn/jiaocheng/1754605016a2707652.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

369IT编程

A Diversity-Promoting Objective Function for Neural Conversation Models论文阅读笔记

新的目标函数

新的目标函数

更多相关文章

全国计算机四级——操作系统原理笔记

PDF公式转化到Word（PDF论文中公式转化）

【个人成长笔记】在Ubuntu中的Linux系统安装sogoupinyin搜狗输入法完整版(亲测有效)

2025年最受欢迎的10款AI论文工具，解决赶稿难题的实用选择。

【论文翻译】Deep Recurrent Q-Learning for Partially Observable MDPs

飞牛Nas每天定时加密数据备份到网盘，基于restic的Backrest笔记分享

提问的智慧( 笔记)

提问的智慧( 中文阅读笔记)#

【笔记】QQ输入法手写识别汉字web版

前端笔记_OAuth规则机制下实现个人站点接入qq三方登录

自己第一阶段笔记

深度学习推荐系统实战笔记

Qt Creator “Promote to“功能 笔记

学术写作|第二篇论文写作记录|GPT4论文润色Prompt

图上的对抗与攻击精选论文列表(​2021相关论文一览)

基于Node.js+vue智能手机推荐平台(开题+程序+论文) 计算机毕业设计

树莓派入门(笔记本当显示屏)

英文论文PDF全文翻译途径整理

英语6级翻译笔记

在线免费PDF英文论文全文翻译

发表评论

推荐文章

linux虚拟IP配置

为什么微信输入法是比搜狗输入法更好的选择？

斐讯k2p梅林忘记密码恢复出厂之后的解决办法

安卓平板大师——全能刷机与系统管理工具实战指南

电脑上的文件夹都是显示英文怎么快速翻译成中文

热门文章

【SCI写作】学术翻译和英文润色prompt

Wine 10.10版本发布，更新了Mono引擎并修复了多款游戏的bug

Claude4 发布：可连续编程7小时，超长上下文！（附一些使用方案）

如何高效清理C盘，让电脑重焕新生

TreeSize Free：硬盘空间分析与管理

【免费下载】 AutoLISP函数参考【中文版】下载仓库

【免费下载】 CAD卸载工具 - Autodesk系列软件一键卸载工具

OpenNJet ： 下一代云原生应用引擎

Win10纯净版与正版：如何选择最适合你的操作系统版本？

怎么把英文翻译成中文？手机中英翻译的简单方法

最新文章

Sublime 32位 激活码

windows下载安装远程桌面工具RealVNC-Server教程(RealVNC_E4_6_1版带注册码)

【亲测免费】 抖音直播伴侣推流密钥获取工具使用教程

【亲测免费】 Proxifer 安装包与注册码

Royal TSX许可证密钥(6.x后所有版本都可以用)

程序员刚毕业，先去大厂镀金还是先去小厂攒经验？

万象2008清空boss账户密码

【Tools】GitBook简明教程

oracle exadata celldisk 闪存盘受损导致性能下降

SDUT 2138 图结构练习——BFSDFS——判断可达性

WordPress get parent category taxonomy

Omit specific product categories from WooCommerce shortcode

Updating Posts table in database without overwriting user generated content

php - Use wp_get_recent_posts with search term

responsive - How to exclude an image size from the Wordpress srcset

Qt Creator “Promote to“功能笔记

图上的对抗与攻击精选论文列表(2021相关论文一览)

OpenNJet ：下一代云原生应用引擎

Sublime 32位激活码

【亲测免费】抖音直播伴侣推流密钥获取工具使用教程