Unleashing the Potential of Large Language Models for Predictive Tabular Tasks in Data Science-369IT编程

admin管理员组
文章数量:1130349

本文是LLM系列文章，针对《Unleashing the Potential of Large Language Models for Predictive Tabular Tasks in Data Science》的翻译。

释放大型语言模型在数据科学预测表格任务中的潜力

摘要
1 引言
2 相关工作
3 方法
4 实验
5 结论

摘要

在数据科学领域，缺失值的分类、回归和插补等预测任务通常会遇到与表格数据相关的挑战。本研究致力于将大型语言模型（LLM）应用于解决这些预测任务。尽管LLM在理解自然语言方面很熟练，但在处理结构化表格数据方面却达不到要求。这种限制源于他们在基础训练期间缺乏对复杂表格数据的了解。我们的研究旨在通过编译一个由指令注释的表组成的综合语料库，并在这个丰富的数据集上执行Llama-2的大规模训练，来缓解这一差距。此外，我们还研究了将训练模型应用于零样本预测、小样本预测和上下文学习场景的实际应用。通过广泛的实验，我们的方法显示出对现有基准的显著改进。这些进步突出了调整LLM训练以解决数据科学中与表格相关的问题的有效性，从而在利用LLM增强表格智能方面建立了一个新的基准。

1 引言

2 相关工作

3 方法

4 实验

5 结论

这项研究开始弥合大型语言模型（LLM）及其在处理结构化表格数据方面的应用之间的差距，结构化表格数据是数据科学的主要内容，但在LLM研究中尚未得到充分探索。通过在Kaggle和其他以表格为中心的来源的精选数据集上对Llama-2模型进行预训练，我们在分类、回

本文是LLM系列文章，针对《Unleashing the Potential of Large Language Models for Predictive Tabular Tasks in Data Science》的翻译。

释放大型语言模型在数据科学预测表格任务中的潜力

摘要
1 引言
2 相关工作
3 方法
4 实验
5 结论

摘要

1 引言

2 相关工作

3 方法

4 实验

5 结论

本文标签： language Models LARGE Unleashing potential

版权声明：本文标题：Unleashing the Potential of Large Language Models for Predictive Tabular Tasks in Data Science 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://it.en369.cn/jiaocheng/1754376412a2679114.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

369IT编程

Unleashing the Potential of Large Language Models for Predictive Tabular Tasks in Data Science

释放大型语言模型在数据科学预测表格任务中的潜力

摘要

1 引言

2 相关工作

3 方法

4 实验

5 结论

释放大型语言模型在数据科学预测表格任务中的潜力

摘要

1 引言

2 相关工作

3 方法

4 实验

5 结论

更多相关文章

Potential算法

2018深度学习李宏毅1-2_ Potential of Deep

Eclipse 代码检测报 Potential null pointer access: The variable XX may be null at this location

Can Large Language Models Beat Wall Street? Unveiling the Potential of AI in Stock Selection

value at risk matlab,Value-at-Risk - Potential Loss Estimation, Portfolio Optimization - MATLAB &amp; Si...

Potential GDP and Economic Growth

ucOS II Potential Issues

7 propagated signaling: the action potential

Potential Errors Passing CRT Objects Across DLL Boundaries

Unlocking Potential with 10 Products for External Community Engagement

Crusher industry large potential demand side quickly capture opportunities

triton-inference-server启动报Internal - failed to load all models

A Large-Scale Chinese Short-Text Conversation Dataset

LLMs：《BLOOM: A 176B-Parameter Open-Access Multilingual Language Model》翻译与解读

图解GPT-2 | The Illustrated GPT-2 (Visualizing Transformer Language Models)

A Comprehensive Survey of Large Language Models and Multimodal Large Language Models in Medicine

读《Diffusion Models: A Comprehensive Survey of Methods and Applications》综述

Datasets for Large Language Models: A Comprehensive Survey

【文献阅读】A Comprehensive Review of Multimodal Large Language Models

A Comprehensive Study of Knowledge Editing for Large Language Models

发表评论

推荐文章

android WebView 实现播放腾讯视频解决全屏播放问题

cache tier分级缓存

python ssh 远程登录路由器执行命令_Python实现ssh批量登录并执行命令

cad四边形展开lisp_快速绘图与展开程序命令集下载-钣金件快速绘图与展开程序CAD插件下载r2.10 免费版-西西软件下载...

Win系统 - 买笔记本看以下几点就差不多了

热门文章

2022年哪些浏览器安全、速度快、好用又不卡？

移动管家手机控车系统硬件安装与软件绑定设置

周易名：传统周易结合现代人工智能起名字

Linux基础知识——基本操作的学习

近期新机怎么选？安卓旗舰成市场新赢家，加持ToDesk远控实现设备自由

百度旗下网站暗藏恶意代码——劫持用户电脑疯狂“收割”流量

Vega prime

思科模拟器Cisco Packet Tracer的下载与安装

团队的英文翻译缩写_(整理)公司部门英文缩写简称大全

【2021819-最新教程】Windows安装MongoDB及配置（超详细）

最新文章

Sublime 32位 激活码

windows下载安装远程桌面工具RealVNC-Server教程(RealVNC_E4_6_1版带注册码)

【亲测免费】 抖音直播伴侣推流密钥获取工具使用教程

【亲测免费】 Proxifer 安装包与注册码

Royal TSX许可证密钥(6.x后所有版本都可以用)

程序员刚毕业，先去大厂镀金还是先去小厂攒经验？

万象2008清空boss账户密码

【Tools】GitBook简明教程

oracle exadata celldisk 闪存盘受损导致性能下降

SDUT 2138 图结构练习——BFSDFS——判断可达性

WordPress get parent category taxonomy

Omit specific product categories from WooCommerce shortcode

Updating Posts table in database without overwriting user generated content

php - Use wp_get_recent_posts with search term

responsive - How to exclude an image size from the Wordpress srcset

value at risk matlab,Value-at-Risk - Potential Loss Estimation, Portfolio Optimization - MATLAB & Si...

Sublime 32位激活码

【亲测免费】抖音直播伴侣推流密钥获取工具使用教程