【深度学习】多元物料融合算法（一）：量纲对齐常见方法-369IT编程

admin管理员组
文章数量:1037775

【深度学习】多元物料融合算法（一）：量纲对齐常见方法

一、引言

类似抖音、快手、小红书等产品的信息流推荐业务，主要通过信息流广告、信息流直播电商等获得经济收益，对于流量最大的核心推荐系统，或多或少都要承担商业指标，承接特定物料的曝光需求。但是广告、直播电商或其他业务物料，会根据自己的需求进行排序，由于不是一套模型，业务场景数据也不一样，插入物料的量纲与主推荐量纲必定不相同，随之但是的就是无法比较问题，如何将不同的量纲对齐且可比呢，今天介绍常见的几种方法。

二、量纲对齐常见方法

2.1 Z-score标准化+Sigmoid归一化

Z-score标准化将数据转换为均值为0、标准差为1的分布。公式如下：

z=\frac{x-\mu }{\sigma }

其中：

是原始数据点

\mu

是序列的均值

\sigma

是序列的标准差

Sigmoid将均值为0、标准差为1的分布转化为值域为0-1的分布。公式为

f(x)=\frac{1}{1+e^{-x}}

Z-score+Sigmoid序列合并计算步骤

对每个序列分别计算均值和标准差。
对每个数据点应用Z-score公式进行标准化。
对标准化后的序列采用Simgoid归一化到0-1后，进行比较。

2.2 Min-Max 归一化

Min-Max 归一化将数据线性地转换到一个固定的区间（通常是 [0, 1]）。公式如下：

其中：

是原始数据点

min是序列的最小值
max是序列的最大值

序列合并计算步骤：

对每个序列分别计算最小值和最大值。
对每个数据点应用上述公式进行归一化。
合并归一化后的序列。

2.3 Rank Transformation

Rank Transformation 将数据转换为它们的秩次。公式如下：

序列合并计算步骤：

对每个序列分别计算每个数据点的秩次。
合并秩次后的序列。

2.4 Log Transformation

如果数据分布偏斜，可以使用对数变换来压缩数据范围。公式如下：

序列合并计算步骤：

对每个序列分别应用对数变换。
合并变换后的序列。

2.5 Robust Scaling

Robust Scaling 使用中位数和四分位距（IQR）进行标准化，适用于存在异常值的数据。公式如下：

是序列的中位数

是序列的四分位距（即第75百分位数减去第25百分位数）

序列合并计算步骤：

对每个序列分别计算中位数和IQR。
对每个数据点应用上述公式进行标准化。
合并标准化后的序列。

3、总结

本文初步介绍了多种将不同量纲的多元物料转换为同一量纲的方法，主要目标就是让不同业务场景的推荐排序结果可以比较，通过公式化的序列转换，快速达到可比的预期，计算效率更高。在实践中，Z-score+Sigmoid方法更为实用。

本文参与腾讯云自媒体同步曝光计划，分享自作者个人站点/博客。原始发表：2025-03-12，如有侵权请联系 cloudcommunity@tencent 删除深度学习信息流排序数据算法

【深度学习】多元物料融合算法（一）：量纲对齐常见方法

一、引言

二、量纲对齐常见方法

2.1 Z-score标准化+Sigmoid归一化

Z-score标准化将数据转换为均值为0、标准差为1的分布。公式如下：

z=\frac{x-\mu }{\sigma }

其中：

是原始数据点

\mu

是序列的均值

\sigma

是序列的标准差

Sigmoid将均值为0、标准差为1的分布转化为值域为0-1的分布。公式为

f(x)=\frac{1}{1+e^{-x}}

Z-score+Sigmoid序列合并计算步骤

对每个序列分别计算均值和标准差。
对每个数据点应用Z-score公式进行标准化。
对标准化后的序列采用Simgoid归一化到0-1后，进行比较。

2.2 Min-Max 归一化

Min-Max 归一化将数据线性地转换到一个固定的区间（通常是 [0, 1]）。公式如下：

其中：

是原始数据点

min是序列的最小值
max是序列的最大值

序列合并计算步骤：

对每个序列分别计算最小值和最大值。
对每个数据点应用上述公式进行归一化。
合并归一化后的序列。

2.3 Rank Transformation

Rank Transformation 将数据转换为它们的秩次。公式如下：

序列合并计算步骤：

对每个序列分别计算每个数据点的秩次。
合并秩次后的序列。

2.4 Log Transformation

如果数据分布偏斜，可以使用对数变换来压缩数据范围。公式如下：

序列合并计算步骤：

对每个序列分别应用对数变换。
合并变换后的序列。

2.5 Robust Scaling

Robust Scaling 使用中位数和四分位距（IQR）进行标准化，适用于存在异常值的数据。公式如下：

是序列的中位数

是序列的四分位距（即第75百分位数减去第25百分位数）

序列合并计算步骤：

对每个序列分别计算中位数和IQR。
对每个数据点应用上述公式进行标准化。
合并标准化后的序列。

3、总结

本文标签：深度学习多元物料融合算法（一）量纲对齐常见方法

版权声明：本文标题：【深度学习】多元物料融合算法（一）：量纲对齐常见方法内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://it.en369.cn/jiaocheng/1748322598a2285417.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

369IT编程

【深度学习】多元物料融合算法（一）：量纲对齐常见方法

【深度学习】多元物料融合算法（一）：量纲对齐常见方法

一、引言

二、量纲对齐常见方法

2.1 Z-score标准化+Sigmoid归一化

2.2 Min-Max 归一化

2.3 Rank Transformation

2.4 Log Transformation

2.5 Robust Scaling

3、总结

【深度学习】多元物料融合算法（一）：量纲对齐常见方法

一、引言

二、量纲对齐常见方法

2.1 Z-score标准化+Sigmoid归一化

2.2 Min-Max 归一化

2.3 Rank Transformation

2.4 Log Transformation

2.5 Robust Scaling

3、总结

更多相关文章

【深度学习】多元物料融合算法（一）：量纲对齐常见方法

发表评论

推荐文章

[c语言日寄]文件操作

如何在 10 分钟内将 DeepSeek API 集成到您的应用程序

重大SBOM风险预警

nginx与apche有什么区别

c++20 在 &lt;chrono&gt; 中的 日历 和 时区 库

热门文章

LINQ(集成查询)语言官方使用教程

混合APP的性能测试

C# 使用 SpeechSynthesizer 类将文本转换为语音

TanStack：一款为现代 Web 开发打造的强大、无头且类型安全的库集合

OpenAI 发布大模型现实世界软件工程基准测试 SWE

【初探数据结构】链表OJ算法——快慢指针

一周掌握FPGA Verilog HDL语法 day 4

牛逼，这款开源聊天应用竟能一键召唤多个AI助手，跨平台通话神器！

面向开发人员和产品经理的提示工程书籍

Ollama 常用命令

最新文章

LLM学习笔记：如何理解LLM中的Transformer架构

o3 deep research: 智能体的应用和演进

从开发者视角洞见未来，找到自己的破局之道：Deepseek和Manus如何助力破局？

嵌入式Linux：阻塞式IO与非阻塞式IO

STM32如何精准控制步进电机？

程序员刚毕业，先去大厂镀金还是先去小厂攒经验？

万象2008清空boss账户密码

【Tools】GitBook简明教程

oracle exadata celldisk 闪存盘受损导致性能下降

SDUT 2138 图结构练习——BFSDFS——判断可达性

How to vary WooCommerce product prices based on order dates

For a menu custom link (without a link) a &quot;#&quot; is appended. Can this just be blank, i.e. NO link?

multisite - Hook into &#39;admin_url&#39; but only on Mysites admin bar menu

Global login to password protected pages

having a page in multi sub-menu and match current-menu-item

c++20 在 <chrono> 中的日历和时区库

For a menu custom link (without a link) a "#" is appended. Can this just be blank, i.e. NO link?

multisite - Hook into 'admin_url' but only on Mysites admin bar menu