论文略读：TFB: Towards Comprehensive and Fair Benchmarking of Time Series Forecasting Methods-369IT编程

admin管理员组
文章数量:1130349

VLDB 2024

包含来自 10 个不同领域的时间序列
提供一个灵活、可扩展且一致的评估流程
对包括统计学习、机器学习和深度学习在内的多种时间序列预测方法进行全面且无偏见的评估

1 intro

之前的benchmark存在的问题
- 数据集覆盖不足
  - 现有的时间序列预测benchmark评估通常只覆盖有限的领域，无法全面反映方法在不同领域的表现。
- 对传统方法的偏见
  - 早期的评估往往忽略了传统方法，如统计学习方法，而只关注基于机器学习和深度学习的方法
- 评估流程不一致和缺乏灵活性
  - 不同的评估基准使用不同的实验设置，如数据划分、归一化方法选择和超参数设置，这使得跨基准的比较变得困难
——>论文的解决方式
- 包含来自10个不同领域的数据集，以提高领域覆盖率
- 支持多种评估策略和指标，涵盖统计学习、机器学习和深度学习方法
- 提供灵活且可扩展的评估流程，确保在相同设置下对不同方法进行评估，以提高比较的公平性

2 不同benchmark的对比

包含的领域对比
不同benchmark涉及内容对比

3 单变量时间序列

每条时间序列用 5 个统计特征表示：

趋势（trend）

季节性（seasonality）

平稳性（stationarity）

漂移（shifting）

转换（transition）

对所有时间序列的这 5 维特征向量进行 PCA降维，映射到二维空间（PC1, PC2），便于可视化比较。

使用 hexbin（六边形网格密度图） 展示每个数据集在这个二维空间上的分布。

灰色区域表示 TFB（ours）的分布范围

蓝色区域表示其他数据集的分布范围，颜色越深，密度越大

——>上图强调了TFB数据集在特征分布多样性方面的覆盖范围

M4虽然覆盖范围更大，但他的样本量要大很多，总计 100,000 个，而TFB的数据集仅包含 8,068 个时间序列。

4 多变量时间序列

5 不同时间序列评估策略

6 TFB整体流程

7 DropLast 问题

“Drop last”是指在时间序列预测的测试阶段中，如果测试数据的最后一个批次（batch）的样本数量少于设定的批次大小（batch size），则通常会选择丢弃这个不完整的批次。
- 这种做法是为了在测试过程中保持数据的一致性和加速计算。
但这种做法可能会导致不公平的比较
- 如果不同的方法在处理最后一个批次时采用不同的策略，比如一些方法丢弃了最后一个批次而另一些方法则没有，这可能会导致评估结果的偏差。
论文中通过实验表明，改变批次大小会影响方法的性能
——>论文提出了一种改进的评估流程，即在测试时不丢弃最后一个批次，而是确保所有方法在相同的策略下进行评估
- 通过调整批次大小或采用其他方法来实现，以确保所有数据都被公平地考虑在内

8 比较的metric

9 主要评估结果

VLDB 2024

包含来自 10 个不同领域的时间序列
提供一个灵活、可扩展且一致的评估流程
对包括统计学习、机器学习和深度学习在内的多种时间序列预测方法进行全面且无偏见的评估

1 intro

之前的benchmark存在的问题
- 数据集覆盖不足
  - 现有的时间序列预测benchmark评估通常只覆盖有限的领域，无法全面反映方法在不同领域的表现。
- 对传统方法的偏见
  - 早期的评估往往忽略了传统方法，如统计学习方法，而只关注基于机器学习和深度学习的方法
- 评估流程不一致和缺乏灵活性
  - 不同的评估基准使用不同的实验设置，如数据划分、归一化方法选择和超参数设置，这使得跨基准的比较变得困难
——>论文的解决方式
- 包含来自10个不同领域的数据集，以提高领域覆盖率
- 支持多种评估策略和指标，涵盖统计学习、机器学习和深度学习方法
- 提供灵活且可扩展的评估流程，确保在相同设置下对不同方法进行评估，以提高比较的公平性

2 不同benchmark的对比

包含的领域对比
不同benchmark涉及内容对比

3 单变量时间序列

每条时间序列用 5 个统计特征表示：

趋势（trend）

季节性（seasonality）

平稳性（stationarity）

漂移（shifting）

转换（transition）

对所有时间序列的这 5 维特征向量进行 PCA降维，映射到二维空间（PC1, PC2），便于可视化比较。

使用 hexbin（六边形网格密度图） 展示每个数据集在这个二维空间上的分布。

灰色区域表示 TFB（ours）的分布范围

蓝色区域表示其他数据集的分布范围，颜色越深，密度越大

——>上图强调了TFB数据集在特征分布多样性方面的覆盖范围

M4虽然覆盖范围更大，但他的样本量要大很多，总计 100,000 个，而TFB的数据集仅包含 8,068 个时间序列。

4 多变量时间序列

5 不同时间序列评估策略

6 TFB整体流程

7 DropLast 问题

“Drop last”是指在时间序列预测的测试阶段中，如果测试数据的最后一个批次（batch）的样本数量少于设定的批次大小（batch size），则通常会选择丢弃这个不完整的批次。
- 这种做法是为了在测试过程中保持数据的一致性和加速计算。
但这种做法可能会导致不公平的比较
- 如果不同的方法在处理最后一个批次时采用不同的策略，比如一些方法丢弃了最后一个批次而另一些方法则没有，这可能会导致评估结果的偏差。
论文中通过实验表明，改变批次大小会影响方法的性能
——>论文提出了一种改进的评估流程，即在测试时不丢弃最后一个批次，而是确保所有方法在相同的策略下进行评估
- 通过调整批次大小或采用其他方法来实现，以确保所有数据都被公平地考虑在内

8 比较的metric

9 主要评估结果

本文标签：论文 Comprehensive FAIR Benchmarking TFB

版权声明：本文标题：论文略读：TFB: Towards Comprehensive and Fair Benchmarking of Time Series Forecasting Methods 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://it.en369.cn/jiaocheng/1758734440a2783491.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

HTML5 Web SQL: A Comprehensive Guide

6月前

HTML5 Web SQL: A Comprehensive Guide Introduction to HTML5 Web SQL HTML5 Web SQL is a web database technology that all

Learning to Rank: From Pairwise Approach to Listwise Approach论文笔记

4月前

【ICML2007】Learning to Rank: From Pairwise Approach to Listwise Approach 原文链接目录 Abstract intro probability models Permu

DWA局部路径规划算法论文阅读 The dynamic window approach to collision avoidance

4月前

Fox D., Burgard W., Thrun S.. (1997). The dynamic window approach to collision avoidance. IEEE Robotics & Automation

大模型剪枝（一）解读Wanda论文: A Simple and Effective Pruning Approach for Large Language Models

4月前

来自2023年的新论文，提出了Wanda这一无需再训练和权重更新的低成本剪枝方法。论文链接：https:arxivpdf2306.11695v2 代码链接：GitHub - locuslabwanda: A simple a

图像融合论文阅读：DenseFuse: A Fusion Approach to Infrared and Visible Images

4月前

一、创新点：1. 提出了一种用于红外和可见图像融合问题的新型深度学习架构。与传统的卷积网络相比，我们的编码网络由卷积层、融合层和密集块组合而成2. 一些基于CNN的图像融合方法&#xff0

论文阅读Jo-SRC: A Contrastive Approach for Combating Noisy Labels

4月前

Jo-SRC: A Contrastive Approach for Combating Noisy Labels Abstract Introduction Method Summary 整理了文章的关键内容，内容源自 Jo-SRC:

【论文阅读笔记】Camera Distance-aware Top-down Approach for 3D Multi-person Pose Estimation from Single RGB

4月前

论文地址：Camera Distance-aware Top-down Approach for 3D Multi-person Pose Estimation from a Single RGB Image 代码地址

【论文阅读】Attributed Graph Clustering: A Deep Attentional Embedding Approach

4月前

【原文】Chun Wang, Shirui Pan, Ruiqi Hu, Guodong Long, Jing Jiang, Chengqi Zhang. Attributed Graph Clustering: A Deep Attent

【论文笔记】PassGAN: A Deep Learning Approach for Password Guessing

4月前

title: “【论文笔记】PassGAN: A Deep Learning Approach for Password Guessing” date: 2019-10-12 lastmod: 2019-10-12 draft: False

论文翻译 —— Model Free Episodic Control

4月前

标题：Model Free Episodic Control文章链接：Model Free Episodic Control代码实现：sudeepraja Model-Fre

【论文翻译】Deep Recurrent Q-Learning for Partially Observable MDPs

4月前

部分可观察MDP的深度循环Q学习摘要：Deep Reinforcement Learning已经为复杂的任务提供了熟练的控制器。然而，这些控制器具有有限的存储器并且依赖于能够在每个决策点处感知

【论文解读】GPT Understands, Too

4月前

一.论文 1.1 P-tuning 区别于之前的工作，这篇工作认为promote可以在句子中的任意位置起到作用，可以将它们插入上下文或目标中上图中，左图是不使用任何操作

【知识】让AI帮你读懂论文的Prompt

4月前

转载请注明出处：小锋学长生活大爆炸[xfxuezhagn] 如果本文帮助到了你，欢迎[点赞、收藏、关注]哦~ 可以直接用我创建的GPT： https:chatgptg

论文学习 | SCAFFOLD 相比基于 GPT-4V 的链式推理（CoT）提示方法具有明显优势

4月前

Scaffolding Coordinates to Promote Vision-Language Coordination in Large Multi-Modal Models https:arxivabs2402.1205

【论文解读】The Power of Scale for Parameter-Efficient Prompt Tuning

4月前

一.介绍 1.1 promote tuning 和 prefix tuning 的关系 “前缀调优”的简化版 1.2 大致实现冻结了整个预训练模型，并且只允许每个下游任务附加k个可调令牌到输入文本。这种“软提

精选3款论文翻译神器，直接翻译PDF全文英文文献！

4月前

全文翻译神器SCI Translate 17.0SCI Translate 是来自国外的一款方便实用，功能强大的论文翻译软件。只需轻轻框选，就可以实现段落甚至整页的快速精准翻译&#xff0

pdf在线翻译_如何在线翻译整篇PDF论文？

4月前

1、首先需要准备一个具有网页在线翻译的浏览器，这里推荐Google Chrome，国内的QQ、360浏览器等同样可以，但需安装相应的翻译插件。(Chrome浏览器自动翻译)2

英文论文PDF全文翻译途径整理

4月前

英文论文PDF全文翻译途径英文论文PDF全文翻译1 有道翻译2 翻译狗3 DocTranslator结语英文论文PDF全文翻译近期的毕业设计需要阅读英文论文，一般格式都是PDF的，感觉看起来有

论文翻译教程

4月前

论文翻译教程 --争取自己博客早日成名的梦想实现人 1文章翻译（GPT的使用） 2文献插入（Endnote）（视频安装&am

《最强码农的水论文攻略》之水论文大法第三期--以IEEE access为例

4月前

相信大家看了我的前几期教程以后，实验指定都是做的差不多了，看来大家也已经到了要水论文的阶段了吧，嘿嘿嘿~~~本期，俺就教大家如何无痛入门，水一篇论文~~~~我先随便写一篇毫无意义的论文在下面，尽量保证每个章节，每个地方都有数据，然后再教

369IT编程

论文略读：TFB: Towards Comprehensive and Fair Benchmarking of Time Series Forecasting Methods

1 intro

2 不同benchmark的对比

3 单变量时间序列

4 多变量时间序列

5 不同时间序列评估策略

6 TFB整体流程

7 DropLast 问题

8 比较的metric

9 主要评估结果

1 intro

2 不同benchmark的对比

3 单变量时间序列

4 多变量时间序列

5 不同时间序列评估策略

6 TFB整体流程

7 DropLast 问题

8 比较的metric

9 主要评估结果

更多相关文章

HTML5 Web SQL: A Comprehensive Guide

Learning to Rank: From Pairwise Approach to Listwise Approach论文笔记

DWA局部路径规划算法论文阅读 The dynamic window approach to collision avoidance

大模型剪枝（一）解读Wanda论文: A Simple and Effective Pruning Approach for Large Language Models

图像融合论文阅读：DenseFuse: A Fusion Approach to Infrared and Visible Images

论文阅读Jo-SRC: A Contrastive Approach for Combating Noisy Labels

【论文阅读笔记】Camera Distance-aware Top-down Approach for 3D Multi-person Pose Estimation from Single RGB

【论文阅读】Attributed Graph Clustering: A Deep Attentional Embedding Approach

【论文笔记】PassGAN: A Deep Learning Approach for Password Guessing

论文翻译 —— Model Free Episodic Control

【论文翻译】Deep Recurrent Q-Learning for Partially Observable MDPs

【论文解读】GPT Understands, Too

【知识】让AI帮你读懂论文的Prompt

论文学习 | SCAFFOLD 相比基于 GPT-4V 的链式推理（CoT）提示方法具有明显优势

【论文解读】The Power of Scale for Parameter-Efficient Prompt Tuning

精选3款论文翻译神器，直接翻译PDF全文英文文献！

pdf在线翻译_如何在线翻译整篇PDF论文？

英文论文PDF全文翻译途径整理

论文翻译教程

《最强码农的水论文攻略》之水论文大法第三期--以IEEE access为例

发表评论

推荐文章

精品H5小游戏源码-免费下载

Apowersoft ApowerMirror v1.4.5 终身商业授权破解版 安卓iPhone投屏控制软件

Free Listing and Free Promote your site!

计算机技术专业面试英语翻译,面试英文翻译：你为什么选择这个专业

google 文档翻译 html,快速将整篇中文文档翻译成全英文（史上最全总结）

热门文章

手机端APP抓包环境的探索（安卓模拟器）

Moto ME525+(ME526, Defy+)刷机经历（烧砖）

ChatGPT APK 安卓手机 安装包

如何将 ChatGPT 集成到你的应用中

如何用Wireshark捕获当前房间路由器和主机的数据包

锤子助手功能七：启用猜拳和骰子作弊

英语在线听力翻译器_英语听力翻译器在线翻译PC版-英语听力翻译电脑版下载 v2.1.4--PC6电脑版...

文档翻译 在线 免费（一译）

Windows环境下nacos的下载与安装

上手评测i710700k和r93900x哪个好-对比性能有什么区别

最新文章

Sublime 32位 激活码

windows下载安装远程桌面工具RealVNC-Server教程(RealVNC_E4_6_1版带注册码)

【亲测免费】 抖音直播伴侣推流密钥获取工具使用教程

【亲测免费】 Proxifer 安装包与注册码

Royal TSX许可证密钥(6.x后所有版本都可以用)

程序员刚毕业，先去大厂镀金还是先去小厂攒经验？

万象2008清空boss账户密码

【Tools】GitBook简明教程

oracle exadata celldisk 闪存盘受损导致性能下降

SDUT 2138 图结构练习——BFSDFS——判断可达性

WordPress get parent category taxonomy

Omit specific product categories from WooCommerce shortcode

Updating Posts table in database without overwriting user generated content

php - Use wp_get_recent_posts with search term

responsive - How to exclude an image size from the Wordpress srcset

Apowersoft ApowerMirror v1.4.5 终身商业授权破解版安卓iPhone投屏控制软件

ChatGPT APK 安卓手机安装包

文档翻译在线免费（一译）

Sublime 32位激活码

【亲测免费】抖音直播伴侣推流密钥获取工具使用教程